Информационно-поисковый тезаурус по сохранности документов (БАН)
Практическая работа №10
Тема: Работа с информационно – поисковыми тезаурусами.
Цель занятия :
Ø Ознакомиться с тезаурусом Eurovoc.
Ø Научиться выполнять поиск правовой информации в тезаурусEurovoc
Порядок выполнения работы :
1. Подключиться к Интернету с помощью программы MicrosoftInternetExplorer
В поле адресной строки введите следующий URL - адрес: http://eurodocs.sdla.gov.ua/
2. Ознакомьтесь с интерфейсом тезаурусEurovoc (на украинском и английском языках )
3. Ознакомьтесь с основным меню тезаурусEurovoc , его составными и их назначением.
4. Опишите содержание разделов тезаурусEurovoc
5. Перечислите основные реквизиты поиска в тезаурусEurovoc
6. Опишите алгоритм поиска информации в тезаурусEurovoc
7. Ознакомьтесь с глоссарием тезаурусEurovoc
8. Найдите в тезаурусEurovoc определение срокам :
· „Эффект распространения"
· ИНИЦИАТОР/СПОНСОР2
· ЭКСПЕРИМЕНТАЛЬНЫЕ ЖИВОТНЫЕ
· Экономическое и социальное согласие
· Расходы на оплату труда
9. Найдите в тезаурусEurovoc необходимую правовую информацию:
10. Приведите наименование срока на четырех языках (украинская, русская, английская, французская) :
· БАЛАНС СИЛ В МЕЖДУНАРОДНЫХ ОТНОШЕНИЯХ
· BALTIC SEA
· ACTIVITE BANCAIRE
· БАЗІЛІКАТА
· PRIX DE BASE
ТЕОРЕТИЧЕСКИЕ СВЕДЕНИЯ:
Примером специализированного тезауруса является многоязычный политематический информационно-поисковый тезаурус EUROVOC, признанный как международный терминологический стандарт. Он реализован в соответствии со стандартами ISO 2788-1986 «Guidelinesfortheestablishmentanddevelopmentofmonolingualthesauri» («Руководство из введения и разработки одноязычных тезаурусов») и ISO 5964-1985 «Guidelinesfortheestablishmentanddevelopmentofmultilingualthesauri» («Руководство из введения и разработки многоязычных тезаурусов»).
|
|
EUROVOC используется для индексирования и поиска данных в ИПС официальных документов органов, учреждений, институтов и некоторых государств — членов ЕС. Этот тезаурус охватывает все темы, важные для деятельности европейских институций, : политика, международные отношения, европейские содружества, законодательство, экономика, торговля, финансы, социальные вопросы, образование и коммуникации, наука, бизнес и конкуренция, занятость и условия труда, транспорт, окружающая среда, сельское хозяйство, лесничество и рыбная ловля, производство, технологии и исследования, энергия, промышленность, география, международные организации. Некоторые темы в EUROVOC разработаны детальнее сравнительно с другими, поскольку они более важны для работы ЕС. Например, тезаурус содержит названия областей каждого государства — члена ЕС, а названия регионов других стран отсутствуют.
|
|
Следует отметить, что одной из характеристик политематических тезаурусов вообще и EUROVOC в частности есть достаточно произвольное группирование дескрипторов за темами. Фактически, некоторые дескрипторы могут касаться двух или больше тем, но для упрощения управления тезаурусом и ограничения его размера принято избегать полеиерархии. Другими словами, дескриптор включают не во все темы, к которым он может принадлежать, а только к той теме, которая кажется наиболее естественной для пользователей.
EUROVOC реализован официальными языками Европейского Союза. Все языки реализации имеют одинаковый статус — каждый дескриптор в одном языке обязательно имеет соответствующий дескриптор в другом языке. Однако, между не-дескрипторами в разных языках не существует эквивалентности, поскольку богатство языков отличается для разных тем.
EUROVOC имеет двухуровневую иерархию. Верхний уровень складывают темы, которые имеют двух символьные коды, например, 12 — «LAW», «Право». Нижний уровень организован как совокупность микротезаурусов, обозначенных четырьмя цифрами, первые две из которых определяют тему, к которой принадлежит этот микротезаурус, : 1216 — «Сriminallaw» («криминальное право»). Нумерация тем и микротезаурусов единственная для всех языков.
|
|
На экране EUROVOC одновременно представлены две панели, которые иллюстрируют выбранный уровень иерархии, : логотип EUROVOC и список тем и микротезаурусов, или список микротезаурусов и содержание выбранного микротезауруса (рис. 3.1), или микротезаурус и его отдельный дескриптор.
На уровне отдельных дескрипторов и недескрипторов структура EUROVOC зависит от семантических отношений, установленных между ними. Предвидены такие их типы:
· «SN« (ScopeNote, примечание относительно возможных значений) — определение, которое уточняет значение дескриптора, или указание, как использовать дескриптор при индексировании документа и формулировке запросов;
· «MT« (Microthesaurus, микротезаурус) — ссылка на микротезаурус, к которой принадлежит дескриптор (недескриптор);
· «UF« (UsedFor, использованный для) и »USE« (использует) — связь эквивалентности между дескриптором и не-дескриптором (-ами), что он их подает (UF), или между недескриптором и дескриптором, который заменяет этот недескриптор (USE). Фактически связь эквивалентности охватывает несколько типов связей :
· полной синонимичности или идентичного значения;
|
|
· близкой синонимичности или похожего значения;
· антонимии или противоположного значения;
· включение, когда дескриптор охватывает одно или больше понятий, которым предоставлен статус недескрипторов, поскольку они редко используются;
· иерархические связки между дескрипторами:
· «BT« (BroaderTerm, более широкий срок) — между определенным дескриптором и родовым (более обобщенным) дескриптором — отмечается с числом, которое показывает количество шагов по иерархии между ними. При этом дескрипторы, для которых не существует более широких сроков, называются сроками верхнего уровня. Некоторые дескрипторы из тем 72 »География« и 76 »Международные организации« есть полииерархическими, другими словами, для них существует больше одного более широкого срока на следующем высшем уровне;
· «NT« (NarrowerTerm, более узкий срок) — между родовым и видовым (более узким) дескриптором — отмечается с числом, которое показывает количество шагов по иерархии между ними;
· «RT« (RelatedTerm, взаимосвязанные сроки) — ассоциативные связки между дескрипторами. Ассоциативная связь показывает лицу, которое проводит индексирование, или пользователю, который существует другой, настолько же или даже более релевантный дескриптор. Предвидены ассоциативные связки таких типов: причины и следствия; органу или инструменту; иерархии (поскольку, как сказано выше, полеиерархия не допускается, потерянные иерархические связки можно заменить ассоциативными); сопровождение; последовательности во времени или пространстве; вхождение в состав; характерной черты; объекта действия или процесса; расположение; подобия (в разе, когда два почти синонимических срока включены как дескрипторы); антонимии.
Рисунок 3.1 - Окно тезауруса EUROVOC:
на левой панели — список микротезаурусов за темами «Европейские содружества», «Право», «Економикс»,
на правой — содержимое микротезауруса «Источника и отрасли права»
Ассоциативные связки имеют такие существенные характеристики:
· они симметричны;
· они несовместимы с иерархическими связками — если два дескриптора связаны иерархией, между ними нельзя установить ассоциативную связь и наоборот;
· между дескрипторами, которые имеют общий срок верхнего уровня, не могут быть установлены ассоциативные связки.
Навигация за тезаурусом осуществляется с помощью ссылок. Дескриптор можно выбрать, набрав на клавиатуре первую букву его названия дескриптора. Также реализованы полнотекстовый поиск и поиск по ключевым словам.
Информационно-поисковый тезаурус по сохранности документов (БАН)
1. Первый отечественный двуязычный тезаурус по сохранности документов, подготовленный в Библиотеке Российской академии наук.тезаурус насчитывает 5 166 терминов.
Издание представляет собой образец смешанного двуязычного (русско-английского) тезауруса. Основным языком выбран английский. Это значит, что в качестве дескрипторов выбраны английские термины, а русские термины приводятся как синонимы.
Настоящий информационно-поисковый тезаурус предназначен для индексирования документов и обработки запросов по обеспечению сохранности (хранению) документов в традиционных и нетрадиционных информационных системах. Тезаурус может использоваться как специальный двуязычный словарь при выполнении переводов с русского на английский и с английского на русский язык, а также как терминологический словарь справочник.
У состав тезауруса входят :
- лексико-семантический указатель;
- иерархический указатель;
- хронологический идентификатор.
2.Дескрипторы часто определяют как классы условной эквивалентности терминов, поскольку имеется поисковая и обычная (общеязыковая) эквивалентность языковых единиц, и эти два вида лексической равнозначности терминов в дескрипторных словарях могут не полностью совпадать. Да, например, в лексических единиц, входящих в дескриптор «DERATISATION c. Дератизация, н. MICE, RATS», содержание понятой «мыши» и «крысы» относятся к семантическим категориям «Живые организмы», «биологический фактор», а понятие «дератизация» - к лексической категории «операции». Но поскольку при проведении поиска информации различия в категориальном значении указанных слов являются не очень существенными и более важным является их информационно-поисковая эквивалентность, в тезаурусе по сохранности документов понятия «мыши» и «крысы» являются нижестоящими по отношению к термину «deratisation».
В лексико-семантическом указателе тезауруса расположены дескрипторные и аскрипторные статьи.
В рамках дескрипторной статьи термины располагаются в следующем порядке:
- заглавные дескрипторы выделены заглавными буквами;
- дополнительные данные;
- аскрипторы или дескрипторы синонимы, которые следуют за индексом «с»;
- вышестоящие дискрипторы следующие за индексом «в»;
- нижестоящие дескрипторы следующие за индексом «н».
Пример:
ACCTSS CONTROL
c Visitors control
Контроль и управление доступом
в ORGANIZATION OF SECURITY SISTEMS
н ACCESS CONTROL
3. В дескрипторных статьях тезауруса отсутствуют :
- лексическое примечание;
-дескрипторы связанные вторыми видами отношений.
Дата добавления: 2021-04-05; просмотров: 231; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!