Концентрация и рассеяние информации



Рассеяние информации означает, что информация, которая была бы полезной для решения данной проблемы, может оказаться в документах, относящихся к совершенно другой предметной области. Следствием свойства рассеяния является дублирование информации - рассредоточение информации, полезной для некоторой предметной области по документам, изданиям и базам данных, относящимся к разным предметным областям.

Рассеяние информации обусловлено социально-экономическим характером научных коммуникаций, и в первую очередь экономическим и авторским правом. Действительно, автор в процессе обучения и работы не только относится к определенной научной школе, но и приобщается к достаточно ограниченному кругу изданий, которые, по его мнению, достаточно адекватно отражают состояние предметной области. Очевидно, что в следствие ограниченности знаний, а также физической доступности многих изданий, этот список будет неполным, но, тем не менее, достаточным для более или менее успешной ОД. Аналогично, новую рукопись автор отправит в одну из редакций, руководствуясь разными факторами, например, авторитетностью, популярностью или даже нетребовательностью издания. В свою очередь, реакция, рассматривая рукопись, может счесть содержание не соответствующим тематике или уровню издания и отклонить её.

Процесс рассеяния имеет устойчивые закономерности. Журналы, которые посвящены непосредственно данной отрасли или предмету, образуют некоторое ядро, вокруг которого можно построить кольцевые зоны, содержащие столько же публикаций по данному вопросу, что и ядро. Этот закон С. Брэдфорд сформулировал следующим образом: «Если научные журналы расположить в порядке уменьшения числа помещенных в них статей по какому-либо заданному предмету, то в полученном списке можно выделить ядро журналов, посвященных непосредственно этому предмету, и несколько групп, каждая из которых содержит столько же статей, что и ядро. Тогда число журналов в ядре и в последующих группах будет относиться как 1 : n : n2…» (Слайд 10.4). То есть, поскольку процесс генерации-публикации сообщений по своей природе является открытой динамической системой, тематическое распределение материалов по изданиям будет иметь ранговый характер.

Именно поэтому при поиске информации следует сосредоточиваться не только на профильных для какой-либо отрасли науки или техники источниках, но и искать информацию в других, даже весьма отдаленных отраслях.

Здесь также следует отметить и не отраженную в явной форме специфику разделения информационных потоков по видам документов соответственно этапам жизненного цикла объекта ОД. Это означает, что реально цикл информационного обмена представляет собой спираль воспроизводства информации: результаты этапа фундаментальных исследований становятся основой на этапе прикладных исследований и разработок, которые в свою очередь, внедряются в производство и т.д. Причем каждый этап, естественно включает все компоненты информационной деятельности.

Сложившаяся система информационных коммуникаций включает (Слайд 10.5):

- «серую литературу» - отчеты о НИР и диссертации, впервые представляющие новые решения или гипотезы, еще не прошедшие широкую проверку практикой и представленную отдельными экземплярами;

- опубликованную научную информацию (статьи и монографии), отражающую в основном апробированные результаты, и изданную достаточно представительными тиражами;

- патенты – правовые документы, объективно отражающие область и уровень предлагаемых решений;

- экономическую, коммерческую и общественно-политическую информацию.

 

Концентрация информации достигается в процессе, который иногда называют свертыванием (т. е. обобщением, агрегированием).

Концентрация в сфере информационной деятельности проявляется, по крайней мере, в трех формах: документационной, фактографической и теоретико-концептуальной (Слайд 10.7).

Первая - документационная форма связана в основном с библиотечной и информационно-поисковой практикой, где в качестве единицы информации выступает документ. Простейшим из них является библиографическая обработка документов, в результате которой в обобщенном виде представляются основные, главным образом внешние идентификационные признаки документа (автор, заголовок, выходные данные и т. п.). Более емким является реферирование, которое предполагает извлечение из документа основных положений содержания и их представление в виде реферата. Близким к этому виду концентрации информации является классифицирование и индексирование, в результате которого на некотором специальном, обычно искусственном, языке отражаются с большей или меньшей степенью глубины и полноты тематические или фактографические признаки содержания документов. Все эти виды концентрации информации предполагают неизбежные потери информации, поскольку в получаемом таким образом вторичном документе отражаются только основные аспекты содержания документов. Отметим также, что своеобразной формой концентрации информации является метаинформация, например, системы классификации и кодирования, тезаурусы и онтологии предметных областей.

Вторая форма - фактографическая концентрация информации, ориентирована не на отдельный документ, а на совокупность фактов или сообщений по определенной теме или проблеме. В качестве таких форм могут выступать реферативные обзоры, фактографические информационные картотеки и т. д.

Третья форма - теоретико-концептуальная концентрация информации - это такое преобразование, которое позволяет представить научное знание на более высоком уровне обобщения. Примером являются аналитические формы представления математических зависимостей, законы, теоремы, позволяющие выводить различные следствия и т. д.

 

Именно возможность работы с компактными хорошо структурированными вторичными документами (а не с их полнотекстовыми представлениями), предметно отражающими содержание первичного документа и обеспечивающим его идентифицируемость, как в целом, так и на уровне отдельных элементов данных, позволяет рационально реализовать поиск информации в сверхбольших документальных потоках.

10.3. Типология документальных БД (Слайд 10.8)

По типу хранимой (немультимедийной) информации выделяют:

фактографические;

документальные;

лексикографические БД.

Лексикографические базы – классификаторы, кодификаторы, словари основ слов, тезаурусы, рубрикаторы и т. д., обычно используемые в качестве справочных совместно с документальными или фактографическими БД.

Документальные базы по уровню представления информации подразделяются на: полнотекстовые (так называемые «первичные» документы), библиографические и реферативные («вторичные» документы, отражающие на адресном и содержательном уровне первичный документ).

По топологии хранения данных различают локальные и распределённые БД.

По типологии доступа и характеру использования хранимой информации БД могут быть разделены на специализированные и интегрированные.

По функциональному назначению (характеру решаемых с помощью БД задач и, соответственно, характеру использования данных) выделяют операционные и справочно–информационные БД.

К последним можно отнести ретроспективные БД (электронные каталоги библиотек, БД статистической информации и т. д.), используемые для информационной поддержки основной деятельности, и не предполагающие внесение изменений в существующие записи, например, по результатам этой деятельности.

По назначению содержащейся информации выделяют БД:

деловой информации (социальная, коммерческая и другая информация, кадастры, регистры);

информации для специалистов (экономическая, правоохранительная и др. информация);

массовой информации.

По способу доступа существуют БД:

размещённые на хостах (доступные через сети);

тиражируемые в коммуникативных форматах;

тиражируемые с программными средствами (включая CD–ROM);

локальные.


Дата добавления: 2021-01-21; просмотров: 346; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!