Общая функциональная структура документальных информационно-поисковых систем.
В состав типичной ДИПС входят, как правило, четыре основные подсистемы (рис.4.1):
1. Подсистема ввода и регистрации.
2. Подсистема обработки.
3. Подсистема хранения.
4. Подсистема поиска.
Текстовые документы, поступающие на вход системы, могут быть представлены как в бумажном, так и в электронном виде (в одном из многочисленных форматов). Поэтому подсистема ввода и регистрации решает следующие основные задачи:
• создание электронных копий бумажных документов (например, сканирование с последующим распознаванием текста или ввод с клавиатуры):
• обеспечение подключения к каналам доставки электронных документов:
• распознавание, а при необходимости и преобразование формата электронных документов;
• присвоение электронным документам уникальных идентификаторов.
Все поступающие документы без внесения в них каких-либо изменений направляются а подсистему хранения для сохранения в базе документов. База документов может представлять собой простую совокупность файлов, распределенную по каталогам жесткого диска. Однако такой тип представления базы документов характеризуется двумя недостатками :
• неэффективным использованием дискового пространства:
• низкой скоростью доступа при большом количестве файлов.
Поэтому для хранения документов применяют средства сжатия и быстрого поиска информации. В этом случае подсистема хранения представляет собой совокупность стандартных или специализированных средств архивации, СУБД и т.п., обеспечивающих возможность доступа к данным по предъявляемому идентификатору.
|
|
Далее документы поступают на вход подсистемы обработки, задачей которой является формирование для каждого документа ПОД, в который заносится информация, необходимая для последующего поиска документа.
ПОД сохраняются в индексе. Логически индекс представляет собой таблицу, строки которой соответствуют документам, а столбцы ~ информационным признакам, на основе которых строится ПОД. В ячейках таблицы могут храниться либо 1. либо 0 ~ в зависимости от наличия или отсутствия данного признака в данном документе.
Очевидно, что такая таблица будет сильно разреженной, и хранить все значения не имеет смысла. Поэтому на практике используют свертку таблицы по строкам или столбцам. Такую форму хранения называют прямой или инверсной соответственно. Поскольку при свертке таблицы структура индекса усложняется, для его поддержания могут использоваться средства СУБД.
При поступлении на вход системы запроса пользователя он преобразуется в ПП и передается в подсистему поиска, задачей которой является отыскание в индексе ПОД, удовлетворяющих ПП с точки зрения КСС. Идентификаторы релевантных документов подаются с выхода подсистемы поиска на вход подсистемы хранения, которая осуществляет выдачу пользователю самих релевантных документов.
|
|
CASE-средства разработки информационных систем. Общая характеристика
Современные CASE-средства охватывают обширную область поддержки многочисленных технологий проектирования ИС: от простых средств анализа и документирования до полномасштабных средств автоматизации, покрывающих весь жизненный цикл ИС.
Обычно к CASE-средствам относят любое программное средство, автоматизирующее совокупность процессов жизненного цикла ПО и имеющее следующие характерные особенности:
• наличие мощных графических средств для описания и документирования ИС, обеспечивающих удобный интерфейс с разработчиком и развивающих его творческие возможности;
• интеграция отдельных компонентов CASE-средств, обеспечивающая управляемость процессом разработки ИС:
• использование специальным образом организованного хранилища проектных метаданных (репозитория).
Современные CASE-системы классифицируются по следующим признакам: 1) по поддерживаемым методологиям проектирования: функционально (структурно-ориентированные, объектно-ориентированные и комплексно-ориентированные (набор методологий проектирования);
|
|
2)по поддерживаемым графическим нотациям построения диаграмм: с фиксированной нотацией, с отдельными нотациями и наиболее распространенными нотациями;
3)по степени интегрированности: tools (отдельные локальные средства), toolkit (набор нейнтегрированных средств, охватывающих большинство этапов разработки ЭИС) и workbench (полностью интегрированные средства, связанные обшей базой проектных данных - репозиторием);
4)по типу и архитектуре вычислительной техники: ориентированные на ПЭВМ, ориентированные на локальную вычислительную сеть (ЛВС), ориентированные на глобальную вычислительную сеть (ГВС) и смешанного типа;
5)по режиму коллективной разработки проекта: не поддерживающие коллективную разработку, ориентированные на режим реального времени разработки проекта, ориентированные на режим объединения подпроектов;
6)по типу операционной системы (ОС): работающие под управлением WINDOWS 95 и выше; работающие под управлением UNIX и работающие под управлением различных ОС.
На сегодняшний день российский рынок программного обеспечения располагает следующими наиболее развитыми CASE-средствами: Vantage Team Builder (Westinouut I-CASE): Desigiier/2000; Silverrun; ERwin+BPwin; S-Designor; CASE. Аналитик.
Примером взаимодействия CASE-средств может являться схема взаимосвязи инструментальных средств компаний Platinum Technology Rational Software.
В частности, к этим средствам относятся: Bpwin (технологии IDEFO, IDEF3, DFD), Erwin (на основе IDEF1X). Model Mart (хранилище моделей), Paradigm Plus (на основе UML), Rational Rose (также использует UML).
Дата добавления: 2018-02-15; просмотров: 1165; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!