Информационно-поисковые системы технологического назначения (ИПС-ТН).



Структура ИПС.

Информационно-поисковая система представляет собой функциональную систему, предназначенную для хранения и поиска информации. Хранение информации возможно только в том случае, если она зафиксирована на каком-либо материальном носителе, т.е. документе, предназначенном для чтения людьми или ввода в ЭВМ (книга, бланк, чертеж, магнитный диск и т.п.). Поэтому ИПС должна иметь запоминающее устройство (ЗУ) в котором располагаются документы (тексты, записи) организуемые в массивах (фондах, файлах, собраниях). Поиск информации - это процесс отыскания в ЗУ ИПС таких документов (текстов, записей), которые соответствуют поступившему запросу. Следовательно, операции хранения и поиска неразрывно связаны. Именно поэтому они осуществляются в рамках единой информационной системы.

Элементами реальной ИПС являются:

- массив документов, выступающих в качестве объекта поиска;

- информационно-поисковый язык (ИПЯ) - искусственный язык, предназначенный для описания содержания и формы документов и (или) запросов для последующего осуществления поиска;

- правила (алгоритмы, методы) индексирования, следуя которым производится описание средствами ИПЯ документов и запросов (перевод их с естественного языка на ИПЯ). В результате индексирования документа получается поисковый образ документа, а индексирования запроса - поисковое предписание;

- правила поиска документов, соответствующих запросу, которые задаются в виде критерия соответствия (критерия выдачи);

- технические средства, с помощью которых реализуется ИПС, т.е. осуществляется хранение и поиск информации;

- обслуживающий персонал - индексаторы и технические работники, обеспечивающие обработку и ввод в систему документов, а также операторы ИПС:

    Информационный запрос не включается в состав ИПС и рассматривается как сигнал, поступающий из внешней среды к оператору.

От состава и тематики документов зависят ИПЯ, правила индексирования и поиска. Выбор ИПЯ обуславливает способ организации ЗУ и пригодные для реализации ИПС технические разработки. ИПЯ и технические элементы ИПС предъявляют определенные требования к квалификации обслуживающего персонала. Учет системных взаимосвязей необходим для разработки реальных ИПС.

В процессе анализа ИПС часто рассматривают отдельно материальные составляющие (массивы документов, технические средства, персонал) и семантические средства (ИПЯ, методы индексирования и поиска). Совокупность ИПЯ, методов индексирования и поиска принято в теории ИПС называть абстрактной ИПС.

С помощью семантических средств ИПС осуществляются смысловые операции обработки документов и запросов и отбор документов, подлежащих выдаче. Последовательность этих операций представляется формулой:

Li               Si               Sd         Ld ;

где Li - текст запроса на естественном языке;

  Si - представление запроса на ИПЯ (поисковое предписание);

  Ld- текст документа на естественном языке;

  Sd - представление документа на ИПЯ (поисковый образ документа);

- -индексирование;

- сопоставление в соответствии с заданным критерием выдачи.

Из формулы видно, что семантические информационно-поисковые операции сводятся к моделированию смысла текста, что требуется для перевода с естественного языка на ИПЯ (операция индексирования) и к сравнению смысла текстов на ИПЯ с тем, чтобы установить их соответствие.


Дата добавления: 2018-02-15; просмотров: 645; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!