Поисковые технологии информационных систем
По используемым поисковым технологиям ИС можно разбить на 4 категории:
1. Тематические каталоги;
2. Специализированные каталоги (онлайновые справочники);
3. Поисковые машины (полнотекстовый поиск);
Средства метапоиска.
В Интернете ИПС размещается на одном или нескольких серверах. В ИПС собирается, индексируется и регистрируется информация о документах, имеющихся в обслуживаемой системой группе веб-серверов. В документах индексируются все значащие слова или только слова из заголовков.
Тематические каталоги предусматривают обработку документов и отнесение их к одной из нескольких категорий, перечень которых заранее задан. Фактически это индексирование на основе классификации. Индексирование может проводиться автоматически или вручную с помощью специалистов, просматривающих популярные веб-узлы и составляющих краткое описание документов-резюме (ключевые слова, аннотация, реферат).
Специализированные каталоги или справочники создаются по отдельным отраслям и темам, по новостям, по городам, по адресам электронной почты и т. п.
Поисковые машины (самое развитое средство поиска в Интернете) реализуют технологию полнотекстового поиска. Индексируются тексты, расположенные на опрашиваемых серверах. Индекс может содержать информацию о нескольких миллионах документов. Например, в индексе популярной ИПС "AltaVista" более 56 млн. URL- адресов.
|
|
При использовании средств метапоиска запрос осуществляется одновременно несколькими поисковыми системами. Результат поиска объединяется в общий, упорядоченный по степени релевантности список. Каждая система обрабатывает только часть узлов сети, что позволяет расширить базу поиска. К подобному классу можно отнести и "персональные программы поиска", позволяющие формировать свои собственные инструменты метапоиска (например, автоматически опрашивать часто посещаемые узлы).
Базы информационных данных могут содержать практически любые виды информации, в том числе в любой комбинации. Информационный поиск осуществляется как по существующим в полнотекстовых ЭИР терминам, так и по специальным элементам, входящим в состав ИПЯ. Для формирования запросов используются специальные информационно-поисковые языки.
ИПС внутри найденной выборки обычно пытаются расположить документы в порядке их "релевантности", то есть близости к введенному пользователем запросу. Критериев такой близости много и выявление близких "по смыслу" к запросу документов не решает проблемы получения информации при отсутствии релевантного документа. Подобная ситуация достаточно тривиальна, в том числе и потому, что пользователь зачастую ищет документ, который сам собирается написать. Следует отметить, что в результате проведенного поиска пользователь может получить как релевантные, пертинентные, так и нерелевантные и непертинентные подмассивы данных.
|
|
ИПС фактически являются системами информационного обеспечения и представляют собой базы и банки данных. В качестве объекта в них выступает индивид, организация, отрасль, регион и т.п. Субъектом информационного обеспечения является специалист-информатик, любой потребитель информации.
Современная страница истории электронных систем начинается с 1989 года публичным представлением агентством Intralex программного комплекса «Юридическая справочно-информационная система», а с 1990 года появлением систем «Кодекс», «Гарант», «Консультант Плюс».
Отличительные особенности представления информации в информационно-справочных системах от интернета заключаются в следующем:
— все документы в системах представлены не разрозненно (отдельно исходный документ, отдельно все изменения и редакции), а комплексно: сами тексты документов включают все изменения, гиперссылки на нормативную базу, сведения о действии и т.д., то есть применительно к системам речь идет о «живых» интерактивных электронных текстах документов;
|
|
— документы из информационно-справочной системы отличаются максимальной достоверностью, законностью, аутентичностью и актуальностью.
Возможности
- интеллектуальный поиск — поиск по свободно сформулированному запросу т.е. (слову, фразе, дате принятия, номеру и т. д.).
- атрибутный поиск — поиск по общим или специализированным атрибутам.
Общие атрибуты — атрибуты, присущие большинству документов (поиск по тексту, наименование, вид документа, принявший орган, номер, дата принятия, актуальность).
Компьютерный вид документа по атрибутам включает в себя:
- тип файла: по расширению (*.txt; *.doc, *.jepg, *.mp3, *.ppt, *xls, …),
- по виду документа (текстовый, табличный, БД, презентация, аудио, графика, инженерная графика, видео, системные файлы…).
Специализированные атрибуты — атрибуты, свойственные данному виду документа.
Дата добавления: 2021-05-18; просмотров: 45; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!