Информационно-поисковый тезаурус по сохранности документов (БАН)



Практическая работа №10

Тема: Работа с информационно – поисковыми тезаурусами.

 

Цель занятия :

Ø Ознакомиться с тезаурусом Eurovoc.

Ø Научиться выполнять поиск правовой информации в тезаурусEurovoc

 

Порядок выполнения работы :

1. Подключиться к Интернету с помощью программы MicrosoftInternetExplorer

В поле адресной строки введите следующий URL - адрес: http://eurodocs.sdla.gov.ua/

2. Ознакомьтесь с интерфейсом тезаурусEurovoc (на украинском и английском языках )

 

 

3. Ознакомьтесь с основным меню тезаурусEurovoc , его составными и их назначением.

4. Опишите содержание разделов тезаурусEurovoc

5. Перечислите основные реквизиты поиска в тезаурусEurovoc

 

6. Опишите алгоритм поиска информации в тезаурусEurovoc

7. Ознакомьтесь с глоссарием тезаурусEurovoc

 

8. Найдите в тезаурусEurovoc определение срокам :

· „Эффект распространения"

· ИНИЦИАТОР/СПОНСОР2

· ЭКСПЕРИМЕНТАЛЬНЫЕ ЖИВОТНЫЕ

· Экономическое и социальное согласие

· Расходы на оплату труда

 

9. Найдите в тезаурусEurovoc необходимую правовую информацию:

 

 

 

 

 

 

10. Приведите наименование срока на четырех языках (украинская, русская, английская, французская) :

 

· БАЛАНС СИЛ В МЕЖДУНАРОДНЫХ ОТНОШЕНИЯХ

· BALTIC SEA

· ACTIVITE BANCAIRE

· БАЗІЛІКАТА

· PRIX DE BASE

 

ТЕОРЕТИЧЕСКИЕ СВЕДЕНИЯ:

 

Примером специализированного тезауруса является многоязычный политематический информационно-поисковый тезаурус EUROVOC, признанный как международный терминологический стандарт. Он реализован в соответствии со стандартами ISO 2788-1986 «Guidelinesfortheestablishmentanddevelopmentofmonolingualthesauri» («Руководство из введения и разработки одноязычных тезаурусов») и ISO 5964-1985 «Guidelinesfortheestablishmentanddevelopmentofmultilingualthesauri» («Руководство из введения и разработки многоязычных тезаурусов»).

EUROVOC используется для индексирования и поиска данных в ИПС официальных документов органов, учреждений, институтов и некоторых государств — членов ЕС. Этот тезаурус охватывает все темы, важные для деятельности европейских институций, : политика, международные отношения, европейские содружества, законодательство, экономика, торговля, финансы, социальные вопросы, образование и коммуникации, наука, бизнес и конкуренция, занятость и условия труда, транспорт, окружающая среда, сельское хозяйство, лесничество и рыбная ловля, производство, технологии и исследования, энергия, промышленность, география, международные организации. Некоторые темы в EUROVOC разработаны детальнее сравнительно с другими, поскольку они более важны для работы ЕС. Например, тезаурус содержит названия областей каждого государства — члена ЕС, а названия регионов других стран отсутствуют.

Следует отметить, что одной из характеристик политематических тезаурусов вообще и EUROVOC в частности есть достаточно произвольное группирование дескрипторов за темами. Фактически, некоторые дескрипторы могут касаться двух или больше тем, но для упрощения управления тезаурусом и ограничения его размера принято избегать полеиерархии. Другими словами, дескриптор включают не во все темы, к которым он может принадлежать, а только к той теме, которая кажется наиболее естественной для пользователей.

EUROVOC реализован официальными языками Европейского Союза. Все языки реализации имеют одинаковый статус — каждый дескриптор в одном языке обязательно имеет соответствующий дескриптор в другом языке. Однако, между не-дескрипторами в разных языках не существует эквивалентности, поскольку богатство языков отличается для разных тем.

EUROVOC имеет двухуровневую иерархию. Верхний уровень складывают темы, которые имеют двух символьные коды, например, 12 — «LAW», «Право». Нижний уровень организован как совокупность микротезаурусов, обозначенных четырьмя цифрами, первые две из которых определяют тему, к которой принадлежит этот микротезаурус, : 1216 — «Сriminallaw» («криминальное право»). Нумерация тем и микротезаурусов единственная для всех языков.

На экране EUROVOC одновременно представлены две панели, которые иллюстрируют выбранный уровень иерархии, : логотип EUROVOC и список тем и микротезаурусов, или список микротезаурусов и содержание выбранного микротезауруса (рис. 3.1), или микротезаурус и его отдельный дескриптор.

На уровне отдельных дескрипторов и недескрипторов структура EUROVOC зависит от семантических отношений, установленных между ними. Предвидены такие их типы:

· «SN« (ScopeNote, примечание относительно возможных значений) — определение, которое уточняет значение дескриптора, или указание, как использовать дескриптор при индексировании документа и формулировке запросов;

· «MT« (Microthesaurus, микротезаурус) — ссылка на микротезаурус, к которой принадлежит дескриптор (недескриптор);

· «UF« (UsedFor, использованный для) и »USE« (использует) — связь эквивалентности между дескриптором и не-дескриптором (-ами), что он их подает (UF), или между недескриптором и дескриптором, который заменяет этот недескриптор (USE). Фактически связь эквивалентности охватывает несколько типов связей :

· полной синонимичности или идентичного значения;

· близкой синонимичности или похожего значения;

· антонимии или противоположного значения;

· включение, когда дескриптор охватывает одно или больше понятий, которым предоставлен статус недескрипторов, поскольку они редко используются;

· иерархические связки между дескрипторами:

· «BT« (BroaderTerm, более широкий срок) — между определенным дескриптором и родовым (более обобщенным) дескриптором — отмечается с числом, которое показывает количество шагов по иерархии между ними. При этом дескрипторы, для которых не существует более широких сроков, называются сроками верхнего уровня. Некоторые дескрипторы из тем 72 »География« и 76 »Международные организации« есть полииерархическими, другими словами, для них существует больше одного более широкого срока на следующем высшем уровне;

· «NT« (NarrowerTerm, более узкий срок) — между родовым и видовым (более узким) дескриптором — отмечается с числом, которое показывает количество шагов по иерархии между ними;

· «RT« (RelatedTerm, взаимосвязанные сроки) — ассоциативные связки между дескрипторами. Ассоциативная связь показывает лицу, которое проводит индексирование, или пользователю, который существует другой, настолько же или даже более релевантный дескриптор. Предвидены ассоциативные связки таких типов: причины и следствия; органу или инструменту; иерархии (поскольку, как сказано выше, полеиерархия не допускается, потерянные иерархические связки можно заменить ассоциативными); сопровождение; последовательности во времени или пространстве; вхождение в состав; характерной черты; объекта действия или процесса; расположение; подобия (в разе, когда два почти синонимических срока включены как дескрипторы); антонимии.

 

 

Рисунок 3.1 - Окно тезауруса EUROVOC:

на левой панели — список микротезаурусов за темами «Европейские содружества», «Право», «Економикс»,

на правой — содержимое микротезауруса «Источника и отрасли права»

 

Ассоциативные связки имеют такие существенные характеристики:

· они симметричны;

· они несовместимы с иерархическими связками — если два дескриптора связаны иерархией, между ними нельзя установить ассоциативную связь и наоборот;

· между дескрипторами, которые имеют общий срок верхнего уровня, не могут быть установлены ассоциативные связки.

Навигация за тезаурусом осуществляется с помощью ссылок. Дескриптор можно выбрать, набрав на клавиатуре первую букву его названия дескриптора. Также реализованы полнотекстовый поиск и поиск по ключевым словам.

 

Информационно-поисковый тезаурус по сохранности документов (БАН)

 

1. Первый отечественный двуязычный тезаурус по сохранности документов, подготовленный в Библиотеке Российской академии наук.тезаурус насчитывает 5 166 терминов.

Издание представляет собой образец смешанного двуязычного (русско-английского) тезауруса. Основным языком выбран английский. Это значит, что в качестве дескрипторов выбраны английские термины, а русские термины приводятся как синонимы.

Настоящий информационно-поисковый тезаурус предназначен для индексирования документов и обработки запросов по обеспечению сохранности (хранению) документов в традиционных и нетрадиционных информационных системах. Тезаурус может использоваться как специальный двуязычный словарь при выполнении переводов с русского на английский и с английского на русский язык, а также как терминологический словарь справочник.

У состав тезауруса входят :

- лексико-семантический указатель;

- иерархический указатель;

- хронологический идентификатор.

2.Дескрипторы часто определяют как классы условной эквивалентности терминов, поскольку имеется поисковая и обычная (общеязыковая) эквивалентность языковых единиц, и эти два вида лексической равнозначности терминов в дескрипторных словарях могут не полностью совпадать. Да, например, в лексических единиц, входящих в дескриптор «DERATISATION c. Дератизация, н. MICE, RATS», содержание понятой «мыши» и «крысы» относятся к семантическим категориям «Живые организмы», «биологический фактор», а понятие «дератизация» - к лексической категории «операции». Но поскольку при проведении поиска информации различия в категориальном значении указанных слов являются не очень существенными и более важным является их информационно-поисковая эквивалентность, в тезаурусе по сохранности документов понятия «мыши» и «крысы» являются нижестоящими по отношению к термину «deratisation».

В лексико-семантическом указателе тезауруса расположены дескрипторные и аскрипторные статьи.

В рамках дескрипторной статьи термины располагаются в следующем порядке:

- заглавные дескрипторы выделены заглавными буквами;

- дополнительные данные;

- аскрипторы или дескрипторы синонимы, которые следуют за индексом «с»;

- вышестоящие дискрипторы следующие за индексом «в»;

- нижестоящие дескрипторы следующие за индексом «н».

Пример:

ACCTSS CONTROL

c Visitors control

Контроль и управление доступом

в ORGANIZATION OF SECURITY SISTEMS

н ACCESS CONTROL

3. В дескрипторных статьях тезауруса отсутствуют :

- лексическое примечание;

-дескрипторы связанные вторыми видами отношений.


Дата добавления: 2021-04-05; просмотров: 231; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!