Особенности представления и использования



Лекция 10.

Назначение документальных ИС. Особенности представления и использования документальной информации. Типология документальных БД.

Типология поисковых задач и режимы обслуживания. Основные процессы обработки и хранения документальной информации.

Назначение документальных ИС

Целью информационного поиска в большинстве случаев является отыскание документов, содержащих сведения, нужные для решения конкретных управленческих, научных или практических задач, в том числе генерации нового знания. При этом характер информации, способ ее представления может быть самым разным – от объявлений о продаже товаров до интерактивных научных конференций, от технического описания, пригодного для непосредственного применения, до не формализуемой в явном виде совокупности фактов, приводящих к творческому озарению или принятию неординарного решения.

Обычно объектом информационного поиска является предметное содержание – данные, методы, инструкции и т.д., позволяющие решить или построить решение конкретной задачи ОД. При этом наиболее распространенной коммуникативной формой представления содержания является документ. Документ по своему статусу соответствует «завершенности» процесса ОД: излагаются, так или иначе, проверенные решения, обоснованные подходы, некоторым образом принятые гипотезы. Однако, в некоторых случаях, когда исследование не завершено, или мы не знаем об этом, будет «естественным» обратиться к «источнику» - индивидуальному или коллективному автору, генерирующему новое знание.

В традиционном цикле информационного обмена основной поток документальной информации идет по цепочке автор–издательство–библиотека–читатель, однако существуют и обходные пути, например: автор–читатель; издательство–читатель (подписка).

Процесс решения любой научной или практической задачи, где, так или иначе, возникает или используется информация, в общем случае включает следующие этапы.

1. Поиск сообщений. Создатель нового знания (потенциальный генератор информации) обращается к информационным ресурсам для получения информации, которая может быть использована им, например, в качестве концептуальной основы, экспериментальных, вспомогательных или опровергаемых данных и т. д. По отношению к среде он будет выступать в качестве потребителя информации, а информационная среда будет источником сообщений. При этом сообщения могут быть получены либо в виде услуги информационных систем, обеспечивающих поиск в различных хранилищах, либо по другим каналам, например, путем личного общения с другими разработчиками, непосредственным обращением к результатам других исследований, в том числе еще не представленных в виде сообщений, и т. д.

2. Интерпретация сообщений. Вследствие уникальности конкретных условий решаемых задач язык полученного сообщения (в общем случае) может быть не тождественен «внутреннему языку» разработчика (создателя информации). Данный этап включает адаптацию сообщений, интерпретацию их содержания в терминах «внутреннего языка», а в итоге - извлечение из сообщений сведений, необходимых для решения поставленной задачи. Результат этапа - информационное обеспечение решаемой задачи, которое должно привести к повышению эффективности ее решения.

3. Решение задачи. На данном этапе, используя информационное обеспечение, а также собственные знания, прилагая определенные усилия, разработчик создает новую информацию, составляющую решение задачи. Эта информация зафиксирована на языке задачи, является достоянием разработчика или достаточно ограниченного множества лиц (организаций), связанных с конкретной разработкой и, как правило, для использования за пределами конкретной задачи будет требовать дополнительных затрат труда.

4. Создание сообщений. На данном этапе исследователь осуществляет интерпретацию полученного результата на «языке коммуникаций», т. е. подготавливает сообщение в «стандартной» форме, одной из тех, которые приняты на данном этапе развития предметной области вообще и информационных коммуникаций, в частности. Результатом этого этапа может быть статья, выступление на конференции, сообщение по электронной почте и т. д. Новая информация, представленная в форме сообщения, уже представляет собой потенциальную общественную ценность для большого круга пользователей и решения других задач.

5. Распространение сообщений. На этом этапе создатели сообщений вступают во взаимодействие с системой научных коммуникаций, затрачивая определенные усилия (в основном организационного характера) по «вводу» сообщения в один (или несколько) из доступных каналов коммуникации (публикация, выступление и т. д.). Эффективность данного этапа определяется как степенью усилий, предпринимаемых исследователем, так и теми возможностями, которые ему предоставляет система коммуникации и, в частности, АИС.

Представленные наслайде (Слайд 10.2)  «каналы» могут быть разделены на три типа:

-непосредственное рабочее взаимодействие разработчиков (связь 3-3) представляет собой постоянный обмен информацией в группе или коллективе в процессе совместной деятельности;

-непосредственное документальное взаимодействие (связь 4-2) заключается в оформлении результата и ограниченном контролируемом распространении (например - передача отчета или документации заказчику);

-опосредованное документальное взаимодействие (связь 5-1) состоит в опубликовании результата и его последующем неограниченном перемещении по каналам ИС. Информационные связи этого типа, осуществляющиеся через АИС, и являются объектом нашего рассмотрения.

Рисунок (Слайд 10.2) представляет схему информационного обмена. Реально же пользователь работает с источником информации по схеме информационного обслуживания, для которой характерна опосредованность, «разорванность», взаимодействия: сообщения «отчуждаются» автора (cоответственно, источник информации ассоциируется уже с сообщением – носителем информации, а не с человеком или системой, которые являются источником в прямом смысле этого слова). Это приводит к «рассеянию» информации, и поэтому для эффективного отыскания публикаций (по времени и необходимым ресурсам) необходимо создавать и использовать специальные справочно-поисковые средства.

 

Новое знание (результат основной деятельности) воплощается обычно в форме сообщения - документа, реализующего преобразование смысла в текст. Такая «материализация» знаний субъекта обеспечивает унифицированную форму обобществления личного знания, а сравнительно низкая стоимость их тиражирования позволяет существенно расширить сферу потенциальных потребителей. Но, с другой стороны, низкая стоимость публикации (по сравнению со стоимостью получения самого результата) приводит к колоссальному и все возрастающему объему публикаций, а унифицированность форм представления обуславливает их внешнюю безликость. Кроме того, чтобы опубликованное сообщение стало стимулом для построения нового знания приемником, сообщение должно быть не только воспринято (выделено среди других и помещено в среду последующей обработки), но также понято (выделен смысл) и вписано в систему наличного знания приемника (потенциально применено) или сохранено в долговременной памяти.

В свою очередь, формирование сообщения, явно или неявно связано с выбором или введением специальной терминологии, что часто сказывается не только на эффективности поиска, но и на адекватности передачи смысла.

Отсюда в частности следует, что «сигнальные» признаки, необходимые для обеспечения эффективности «узнавания» - первой фазы использования сообщения, могут быть сформированы путем введения явной систематизации. Это достаточно естественный путь – знания всегда системны, т.к. создаются в рамках некоторой системы понятий соответствующей отрасли знаний. И именно это обеспечивает приемлемые условия для ознакомления с более или менее представительным объемом публикаций в конкретной предметной области путем, отличным от полного перебора всех сообщений.

То есть процессы обработки и поиска информации не могут рассматриваться изолированно от процессов основной деятельности, поскольку обусловлены ими, а действенность информации обуславливается «коммуникационными» средствами ИС (например, лингвистическим обеспечением).

Отсюда следует, что назначение документальных ИС – это обеспечение передачи информации от генератора к потребителю, а эффективность ИС будет связываться с замещением части основной деятельности информационной.

Особенности представления и использования

Документальной информации

Требования к полноте, точности и достоверности информации, характеру процесса поиска, а в большей степени – к выбору типов и набора информационных ресурсов, а также последующей обработке найденного зависят от характера задачи (и текущего этапа жизненного цикла). Действительно, когда задача сформулирована в сложившейся предметной области и её актуальность не вызывает сомнений, цель поиска очевидна: найти полноценное изложение метода решения задачи данного типа (например, отчет о НИР, статью, учебник и т.д., достоверность которого не подлежит сомнениям). Во многих случаях (обычно, когда мы ищем уже известный человечеству метод) это можно сделать, не прибегая к «сложным» процедурам, использующим разнообразные, но вспомогательные средства: указатели, реферативно–библиографические БД и т.д. Достаточно «просто» пролистать разделы соответствующих учебников или монографий или, в крайнем случае – подшивку специальных журналов. Предложения библиотек и информационных служб использовать специальные справочно-поисковые средства, к тому же не содержащих полных текстов, кажутся многим современным пользователям абсурдными. Их использование становится неизбежным, когда собственные «подручные» ресурсы не позволяют найти решение, а характер ОД предполагает реальную ответственность (экономическую или юридическую) за принятие решения. Общеизвестными примерами являются задачи патентного поиска, позволяющего подтвердить приоритет изобретения, или научного поиска, доказывающего новизну решения.

Существенно другая роль вторичной информации на начальном и заключительном этапах ОД, в бизнес-планировании и в задачах управления качеством. Например, при определении направления деятельности, выборе решения при неполной информации, принятии решения о начале или завершении деятельности, оценке эффективности и применимости, оценке новизны и конкурентоспособность найденного решения. Очевидно, что искать документ, содержащий ответ, можно, если мы сознательно повторяем работы, выполненные кем-то ранее. То есть, информация такого рода – общее заключение (отдельное, «дискретное» решение), может быть только синтезирована на основе многоаспектного содержательного и статистического анализа «непрерывного» потока публикаций, отражающего не только разные подходы к решению, но и разные этапы жизненного цикла идеи.

Таким образом, можно сказать, что, в отличие от задач нахождения отдельной публикации о методе решения частной проблемы, своей конкретностью предопределяющих требование точности информационного представления, задачи ОД управленческого типа (выделение отдельных типов ОД здесь достаточно условно, поскольку при принятии «управленческого» решения мы обобщаем «частные» решения, а при поиске и выборе «частного» решения мы должны ориентироваться на общие направления и использовать общепринятые критерии) предполагают широту и вариантность анализа возможных решений, что предопределяет требование полноты и многоаспектности информационного обеспечения.

Библиографический поиск обеспечивает выявление публикаций по их выходным данным, например, по именам авторов, датам публикаций и т.д. Основополагающей предпосылкой здесь является фиксированная для конкретной базы данных модель представления информации, в соответствии с которой обеспечивается нормализованная (единообразная) запись элементов данных. Все это требует от пользователя далеко не очевидных знаний определенных соглашений. Кроме того, практика показывает, что подобные соглашения не всегда соблюдаются не только для различных баз данных, но иногда даже и в рамках одной базы данных.

Тематический поиск обеспечивает отбор документов по семантическим признакам, обобщенно представляющим его содержание. Здесь концептуальным положением является то, что содержание документа может быть представлено некоторой совокупностью понятий, характеризующих основной объект. Это позволяет достаточно эффективно использовать запросы в виде компактных комбинации терминов, обычно двух-трех слов естественного или естественно-научного языка. Такое представление информации хорошо соответствует теоретико-множественным моделям поиска, однако для многих пользователей создает ситуации непонимания поискового языка и самого процесса получения результата.

Отдельным направлением в развитии информационного поиска является полнотекстовый поиск, основная цель которого – обеспечить точный отбор за счет применения критериев, основанных на семантических категориях. Но здесь, не смотря на достаточно серьезные достижения в области анализа текста и появление промышленных полнотекстовых поисковых систем (в основном в сфере СМИ), ожидать скорого широкого внедрения систем полнотекстового поиска, в том числе и в область научной информации, не приходится уже хотя бы потому, что выявить и воспринять смысл (и тем более новые идеи) в научных публикациях может не всегда и не всякий естественный интеллект. И уж тем более сомнительно автоматически построить понятийную, точно отражающую смысл, структуру по тексту запроса из трех-четырех терминов.

Также важным, но часто не замечаемым фактором является реальная ограниченность полноты представления информации в конкретном массиве (точнее, источников информации, которые используются для формирования массива). Это особенно существенно при поиске в Internet: глобальная сеть сетей физически объединяет компьютеры практически всех крупнейших библиотек мира, однако вход пользователя в сеть не приводит автоматически к возможности использовать электронный каталог какой-либо из таких библиотек. То есть, подключение к сети обеспечивает физическую доступность вычислительного комплекса хранящего ресурс, но доступность собственно информационного ресурса – обычно совокупности баз данных (документальных и фактографических массивов) и информационных технологий, часто ограничена технологическими, организационными, финансовыми или какими либо другими условиям.


Дата добавления: 2021-01-21; просмотров: 67; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!