Общая функциональная структура документальных информационно-поисковых систем.



В состав типичной ДИПС входят, как правило, четыре основные подсистемы (рис.4.1):

1. Подсистема ввода и регистрации.

2. Подсистема обработки.

3. Подсистема хранения.

4. Подсистема поиска.

Текстовые документы, поступающие на вход системы, могут быть представлены как в бумажном, так и в электронном виде (в одном из многочисленных форматов). Поэтому подсистема ввода и регистрации решает следующие основные задачи:

• создание электронных копий бумажных документов (например, сканирование с по­следующим распознаванием текста или ввод с клавиатуры):

• обеспечение подключения к каналам доставки электронных документов:

• распознавание, а при необходимости и преобразование формата электронных доку­ментов;

• присвоение электронным документам уникальных идентификаторов.

Все поступающие документы без внесения в них каких-либо изменений направляются а подсистему хранения для сохранения в базе документов. База документов может пред­ставлять собой простую совокупность файлов, распределенную по каталогам жесткого диска. Однако такой тип представления базы документов характеризуется двумя недос­татками :

• неэффективным использованием дискового пространства:

• низкой скоростью доступа при большом количестве файлов.

Поэтому для хранения документов применяют средства сжатия и быстрого поиска информации. В этом случае подсистема хранения представляет собой совокупность стан­дартных или специализированных средств архивации, СУБД и т.п., обеспечивающих воз­можность доступа к данным по предъявляемому идентификатору.

Далее документы поступают на вход подсистемы обработки, задачей которой являет­ся формирование для каждого документа ПОД, в который заносится информация, необхо­димая для последующего поиска документа.

ПОД сохраняются в индексе. Логически индекс представляет собой таблицу, строки которой соответствуют документам, а столбцы ~ информационным признакам, на основе которых строится ПОД. В ячейках таблицы могут храниться либо 1. либо 0 ~ в зависимо­сти от наличия или отсутствия данного признака в данном документе.

Очевидно, что такая таблица будет сильно разреженной, и хранить все значения не имеет смысла. Поэтому на практике используют свертку таблицы по строкам или столб­цам. Такую форму хранения называют прямой или инверсной соответственно. Поскольку при свертке таблицы структура индекса усложняется, для его поддержания могут исполь­зоваться средства СУБД.

При поступлении на вход системы запроса пользователя он преобразуется в ПП и пе­редается в подсистему поиска, задачей которой является отыскание в индексе ПОД, удов­летворяющих ПП с точки зрения КСС. Идентификаторы релевантных документов пода­ются с выхода подсистемы поиска на вход подсистемы хранения, которая осуществляет выдачу пользователю самих релевантных документов.


CASE-средства разработки информационных систем. Общая характеристика

Современные CASE-средства охватывают обширную область поддержки многочис­ленных технологий проектирования ИС: от простых средств анализа и документирования до полномасштабных средств автоматизации, пок­ры­ваю­щих весь жизненный цикл ИС.

Обычно к CASE-средствам относят любое программное средство, авто­матизирующее совокупность процессов жизненного цикла ПО и имеющее следующие характерные осо­бенности:

• наличие мощных графических средств для описания и докумен­ти­ро­ва­ния ИС, обеспечивающих удобный интерфейс с разработчиком и развивающих его творческие воз­можности;

• интеграция отдельных компонентов CASE-средств, обеспечивающая управляе­мость процессом разработки ИС:

• использование специальным образом организованного хранилища проектных ме­таданных (репозитория).

Современные CASE-системы классифицируются по следующим приз­на­кам: 1) по поддерживаемым методологиям проектирования: функционально (структурно-ориентированные, объектно-ориентированные и комплексно-ориентированные (набор ме­тодологий проектирования);

2)по поддерживаемым графическим нотациям построения диаграмм: с фиксирован­ной нотацией, с отдельными нотациями и наиболее распространенными нотациями;

3)по степени интегрированности: tools (отдельные локальные средства), toolkit (на­бор нейнтегрированных средств, охватывающих большинство этапов разработки ЭИС) и workbench (полностью интегрированные средства, связанные обшей базой проектных данных - репозиторием);

4)по типу и архитектуре вычислительной техники: ориентированные на ПЭВМ, ориентированные на локальную вычислительную сеть (ЛВС), ориен­тированные на гло­бальную вычислительную сеть (ГВС) и смешанного типа;

5)по режиму коллективной разработки проекта: не поддерживающие коллективную разработку, ориентированные на режим реального времени разработки проекта, ориенти­рованные на режим объединения подпроектов;

6)по типу операционной системы (ОС): работающие под управлением WINDOWS 95 и выше; работающие под управлением UNIX и работающие под управлением различных ОС.

На сегодняшний день российский рынок программного обеспечения располагает следующими наиболее развитыми CASE-средствами: Vantage Team Builder (Westinouut I-CASE): Desigiier/2000; Silverrun; ERwin+BPwin; S-Designor; CASE. Аналитик.

Примером взаимодействия CASE-средств может являться схема взаимосвязи инстру­ментальных средств компаний Platinum Technology Rational Software.

В частности, к этим средствам относятся: Bpwin (технологии IDEFO, IDEF3, DFD), Erwin (на основе IDEF1X). Model Mart (хранилище моделей), Paradigm Plus (на основе UML), Rational Rose (также использует UML).


Дата добавления: 2018-02-15; просмотров: 1165; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!