ПОИСК ЛИТЕРАТУРЫ ПО ТЕМЕ В СЕТИ И ОФОРМЛЕНИЕ БИБЛИОГРАФИЧЕСКОГО СПИСКА



КОМПЬЮТЕРНЫЕ ТЕХНОЛОГИИ В НАУКЕ И ПРОИЗВОДСТВЕ

Практикум

 


ВВЕДЕНИЕ

Данный практикум предназначен для закрепления основных знаний по курсу «Компьютерные технологии в науке и производс- тве» и получения навыков работы с поисковыми системами и биб- лиотечными ресурсами в Интернете; обработки, структуризации, анализа, моделирования и визуализации информации с помощью электронных таблиц MS Excel, математического пакета Mathcad, системы управления базами данных MS Access; оформления ре- зультатов исследований в текстовом редакторе MS Word, подго- товки демонстрационных материалов средствами MS PowerPoint, а также создания сайтов в сети Интернет для размещения научной информации.


Практическая работа 1

ПРИМЕНЕНИЕ ПОИСКОВЫХ СИСТЕМ В ИНТЕРНЕТЕ

Цель работы – научиться выбирать и применять поисковые системы для поиска научной информации.

 

1.1. Краткое изложение основных теоретических и методических аспектов работы

Поисковые системы (ПС) обеспечивают более удобный доступ пользователей сети к информационным ресурсам Интернета.

Основные компоненты ПС

Spider (паук) – специальная программа, похожая на браузер, за- нимается скачиванием в базу данных ПС найденных краулером но- вых сайтов и страничек в Интернете. Так как Spider – это по своей сути поисковый робот, то он «видит» только HTML-код страницы. Без графики, баннеров, скриптов и т. п.

Crawler («путешествующий» паук) – специальная программа, которая в автоматическом режиме осуществляет поиск новых сай- тов и страниц в Интернете. Основная его задача – обнаружение еще не известных поисковой системе документов. Crawler исполь- зует для этого известные сайты, переходя по имеющимся на них ссылкам. Некоторые ПС используют вместо Spider и Crawler одну программу, которая сразу и находит, и скачивает информацию.

Indexer (индексатор) – эта программа анализирует скачанные страницы на предмет их соответствия различным поисковым за- просам. Полный алгоритм работы этой программы является закры- той информацией и он индивидуален у ПС.

Database (база данных) – база, где хранятся все найденные и скачанные поисковыми роботами страницы сайтов. Некоторые ПС используют общую базу данных.

Web server (сам сайт ПС) – то, что мы все наблюдаем в окошке браузера, когда вводим поисковый запрос в строку поиска. Отвеча- ет за выдачу результатов поиска.


Поиск нужной информации в ПС происходит по ключевому слову, или словосочетанию, которые больше всего соответствуют той теме, информацию по которой необходимо найти. Именно эти слова или словосочетания вбиваются пользователями Интернета в строку поиска.

Для этой цели системы поиска применяют набор различных

программ, выполняющих следующие функции:

- поиск сайтов;

- их классификацию по соответствию тому или иному запросу;

- ранжирование сайтов по их качеству;

- и многое другое.

Процесс работы ПС – сбора обработки и выдачи информа- ции – выглядит примерно следующим образом.

1. Поисковый робот (паук) «бродит» по виртуальному про- странству, отыскивая по ссылкам новые сайты и новые страницы старых сайтов, и заносит их адреса в базу данных.

2. Другой робот скачивает всё текстовое содержание этих стра- ниц и тоже отправляет их в базу данных. В базе данных страницы хранятся и ждут, когда их проиндексирует другая программа.

3. Составляются каталоги с адресами и кратким описанием этих страниц.

4. ПС выдают адреса страниц в порядке степени их соответс- твия каждому поисковому запросу пользователя.

Время, за которое ПС успевают найти новый сайт, проанализи- ровать его и начать выдавать по поисковым запросам, составляет от нескольких недель до нескольких месяцев.

Несмотря на различные интерфейсы и набор дополнительных функций, основные действия для всех ПС едины:

- они «обыскивают» Интернет (или какой-то его сектор) на основе

ключевых слов, заданных в строке поиска;

- ПС индексируют слова, которые они ищут, и места, где их находят;

- ПС позволяют пользователям искать слова или комбинации из ключевых слов на основе уже проиндексированных и занесен- ных в свои базы данных web-страниц.

Поиск, основанный на булевских операторах (AND, OR,

NOT), – это буквенный поиск. ПС получает поисковые  слова


ровно так, как они введены. Это может вызвать проблему, когда, например, введенное слово имеет множество значений. «Ключ», например, может означать «средство для открытия двери», а мо- жет означать «пароль» для входа на сервер. Если интересует только одно значение слова, то, очевидно, будут не нужны данные по его второму значению. Можно построить буквальный запрос, который позволит исключить вывод данных по ненужному значению слова, но лучше, если бы ПС смогла это сделать сама.

Одна из областей исследований в области развития алгоритмов поисковых машин – концептуальный поиск информации. Это та- кие алгоритмы, когда для нахождения релевантных данных исполь-

зуется статистический анализ страниц, содержащих данное поиско-

вое ключевое слово или фразу. Концептуальной поисковой машине требуется гораздо больший объем для хранения данных о каждой странице и больше времени для обработки каждого запроса.

Другая перспективная область – разработка поисковых ал-

горитмов на основе запросов естественного языка (Natural- Language query).

Идея естественных запросов состоит в том, чтобы написать запрос так, как вопрос задается человеку: без использования спе- цифической лексики и знаков, например булевских операторов. Самый популярный на сегодня поисковый сайт на основе язы- ка естественных запросов – это Ask.com. Он преобразует запрос в ключевые слова, которые затем и использует при индексировании сайтов. Этот подход работает только в случае простых запросов.

Сравнение поисковых машин является комплексной задачей. Сравнивать поисковые системы можно с различными целями.

«Лучше» по отношению к ПС означает – найти нужную инфор- мацию быстрее и с минимумом умственных и физических усилий пользователя.

Под «нужной» понимают авторизованную, достоверную, акту-

альную, хорошо оформленную, структурированную, максимально полную информацию, точно соответствующую реальной потреб- ности обращения к поиску.

Основными критериями комплексной оценки качества ПС яв- ляются:


- навигационный поиск – сравнивается способность ПС находить известные сайты;

- тематический (экспертный) поиск – сравнивается способность ПС формировать выдачу, близкую к ручной экспертной подбор- ке ссылок;

- подсказки – сравнивается способность ПС замечать ошибки при наборе запроса и подсказывать пользователям правильные варианты;

- опечатки – сравнивается способность ПС не реагировать на яв-

ные опечатки при наборе запроса и выдавать результаты, как для запросов, без опечаток;

- цитаты – сравнивается способность ПС находить источники из- вестных цитат;

- оригиналы – сравнивается способность ПС находить первоис- точники;

- синонимы – сравнивается способность ПС правильно распозна- вать одинаковые по смыслу запросы с разными формулировками;

- спам – сравнивается способность ПС удалять спам из результа- тов поиска;

- SEO-прессинг (монотематичность выдачи) – сравнивается спо- собность ПС противостоять попыткам оптимизаторов в коммер- чески значимых тематиках превратить выдачу в набор однотип- ных рекламных ссылок;

- порно – сравнивается способность ПС фильтровать ссылки на порно-сайты по не относящимся к порнотематике запросам;

- полнота – сравнивается способность ПС отвечать на редкие за- просы.

Дополнительные характеристики качества заключаются в анализе:

- региональной выдачи;

- наличия дубликатов контента в топовых ссылках выдачи;

- обработки сокращений и аббревиатур;

- выявления смысла нечетких  запросов;

- качества поиска программного обеспечения;

- качества поиска известных тематических форумов.


Контрольные вопросы

1. Почему сайт, написанный с минимальным использованием html и содержащий множество графики, анимации и java-скриптов, не виден поисковым системам?

2. Какой элемент поисковой системы главным образом определяет ее уникальность – отличие от других поисковых систем?

3. Каковы основные действия всех поисковых систем?

4. Опишите пути и перспективы развития поисковых систем.

5. Как можно сравнивать качество поиска различных поисковых систем?

 

1.2. Порядок выполнения задания

1. Перед выполнением задания изучить п. 1.1 практикума и от- ветить на контрольные вопросы.

2. Найти 5 глобальных поисковых систем, используя одни систе- мы для поиска других. Кратко ознакомиться с их возможностями и особенностями. Результаты работы представить в виде в таблицы:

 

№ п/п Наименование системы URL Отличительные особенности
       

 

3. Выбрать и согласовать с преподавателем поисковую тему. Не следует выбирать слишком узкое направление поиска и просто ко- пировать тему диплома или диссертации в запрос. Поисковая тема

«Влияние субгармонических колебаний спектра Юпитера на се- зонную миграцию сельди в юго-восточной части Саргассова моря» не годится. Варианты пригодных поисковых тем, связанных с из- ложенной: «колебания спектров планет» или «сезонная миграция рыб» и «промысловые рыбы Саргассова моря» и т. п.

4. Найти специализированную поисковую систему, подходя- щую для выбранной цели поиска. Для этого необходимо сфор- мулировать запрос к одной из глобальных поисковых систем, на- правленный на обнаружение поисковой системы по конкретной

области информации.


5. Сравнить результаты поиска по глобальным и специализи- рованным поисковым системам, используя первые 20 результатов. Критерии оценки:

- повторяемость – сколько уникальных сайтов в первой 20-ке ре- зультатов поиска;

- уровень спама – количество «информационного мусора» в пер- вой 20-ке результатов поиска. Информационным мусором счи- тается сайт, не соответствующий по содержанию запросу;

- свежесть информации – количество неработающих ссылок в пер- вой 20-ке результатов поиска.

Результаты сравнения представить в виде таблицы:

 

№ п/п Наименование системы Повторяемость Уровень спама Свежесть информации
         

 

6. Выполнить поиск по англоязычной области Интернета, переведя поисковый запрос. Перевод поискового запроса можно сделать:

- применив собственное знание языка в области специализации;

- с помощью интенет-переводчика;

- используя присутствующий в некоторых поисковых системах встроенный переводчик.

7. Просмотреть результаты поиска. Привести список 10 найден-

ных URL.

8. Составить краткую справку (1 стр.) по теме поиска, копируя ин- формацию из найденных источников в файл отчета с указанием URL источников. Использовать не менее 3-х источников. Также привести обязательно один англоязычный источник в оригинале и в переводе.

9. Сформулировать и внести в файл выводы по работе.

 

1.3. Требования к оформлению, процедура защиты

Отчет о лабораторной работе должен содержать описание хода выполнения каждой задачи, пояснения к решению. При защите необходимо дать требуемые пояснения к содержанию отчета и от- ветить на контрольный вопрос. Допускается представление отчета в электронном виде в редакторе MS Word.


Практическая работа 2

ПОИСК ЛИТЕРАТУРЫ ПО ТЕМЕ В СЕТИ И ОФОРМЛЕНИЕ БИБЛИОГРАФИЧЕСКОГО СПИСКА

Цель работы – научиться находить литературу по теме исследо- вания в библиотечных интернет-каталогах и оформлять библиогра- фические ссылки и списки.

 

2.1. Краткое изложение основных теоретических и методических аспектов работы

Поиск информации в электронных каталогах библиотек

Очень важным элементом при выполнении любой научной рабо- ты является составление обзора достижений в исследуемой области. Для этого применяются различные подходы, в частности, осущест- вляется поиск информации в реферативных журналах, каталогах библиотек, библиотечных интернет-каталогах, сети Интернет.

В данном задании остановимся на поиске литературы в библи- отечных электронных каталогах. В качестве инструмента поиска используем сайт (рис. 1) государственной публичной научно-тех- нической библиотеки России (ГПНТБ России) – http://www.gpntb. ru/. Эта библиотека находится в ведении Министерства образова- ния и науки Российской Федерации.

ГПНТБ России является центральным органом НТИ, государс- твенным депозитарием отечественной и зарубежной научно-техни- ческой литературы, автоматизированным информационным цент- ром, координационным центром по методологии комплектования, МБА, книгообмену среди научно-технических библиотек страны, головной организацией по ведению и развитию автоматизирован- ной системы Сводного каталога России и стран СНГ по научно- технической литературе.

Для поиска необходимой литературы читателям предоставлены каталоги и картотеки как в традиционной форме, так и в электрон- ном виде.


 

Рис. 1. Стартовая страница сайта ГПНТБ

 

Карточные каталоги и картотеки

Для поиска конкретного издания по алфавиту:

- отечественных и иностранных книг;

- отечественных и зарубежных периодических изданий;

- отечественных и зарубежных журналов (включают поступления за последние 3 года);

- препринтов с 1980 года;

- неопубликованных переводов до 1997 года;

- алфавитный;

- алфавитно-нумерационный;

- алфавитно-хронологический источников переводов. Для тематического поиска:

- систематический каталог (УДК);

- систематическая картотека авторефератов диссертаций;

- систематическая картотека препринтов;

- систематическая картотека периодики;

- предметный каталог (в соответствии с предметным рубрикато- ром ГПНТБ России).


Общее число библиографических карточек в традиционных ка- талогах и картотеках ГПНТБ России – около 20 миллионов.

Электронные каталоги

В электронном каталоге ГПНТБ России содержатся сведения о всех видах литературы, поступающей в фонд библиотеки:

- отечественные книги с 1990 года;

- отечественные журналы с 1994 года;

- авторефераты диссертаций с 1991 года;

- неопубликованные переводы 1992–1996 гг.;

- зарубежные книги с 1990 года;

- зарубежные журналы с 1992 года.

База данных российского сводного каталога по научно-техни-

ческой литературе содержит сведения о зарубежных и российских книгах и зарубежных периодических изданиях по естественным наукам, технике, сельскому хозяйству и медицине, поступивших

в библиотеки и организации страны, являющиеся участниками АС

РСвК (автоматизированная система Российского сводного катало- га по научно-технической литературе).

Объем БД на конец 2008 года составляет около 805 тысяч запи- сей, ежегодное пополнение около 30 тыс. записей по всем видам изданий, БД ведется с 1987 года. БД адресно-библиографическая. Каждая запись содержит, кроме библиографического описания на языке оригинала, индексы Рубрикатора ГРНТИ, коды органи- заций-фондодержателей. Кроме того, часть записей БД содержит библиографическое описание зарубежных книг (перевод заглавия на русском языке, предметные рубрики и ключевые слова); зару- бежных периодических изданий (аннотация на русском языке; рос- сийские книги – аннотацию на русском и/или английском языках и предметные рубрики).

Поиск в электронном и сводном каталогах организован на базе современных средств информационного обеспечения и включает


использование электронных баз данных по УДК, ГРНТИ, клас- сификации Дьюи, ключевых терминов со словарно-тезаурусной поддержкой.

Оформление библиографических ссылок

Библиографическая ссылка содержит библиографические сведения о цитируемом, рассматриваемом или упоминаемом в тексте документе (его составной части или группе документов), необходимые и достаточные для его идентификации, поиска и об- щей характеристики.

Объектами составления библиографической ссылки являют- ся все виды опубликованных и неопубликованных документов на любых носителях (в том числе электронные ресурсы локального и удаленного доступа), а также составные части документов.

Полную ссылку, содержащую совокупность библиографических

сведений о документе, предназначенную для общей характеристи- ки, идентификации и поиска документа – объекта ссылки, состав- ляют по ГОСТ 7.1, ГОСТ 7.82, ГОСТ 7.80 (тексты этих стандартов можно найти на сайте ТГУ по ссылке http://library.tltsu.ru/sites/site. php?s=122&m=28351), выполняют для описания документов, кото- рое составляется библиотеками, органами научно-технической ин- формации, центрами государственной библиографии, издателями, другими библиографирующими учреждениями.

В остальных случаях применяют краткую ссылку по ГОСТ Р 7.0.5–2008, предназначенную только для поиска докумен- та – объекта ссылки, составляют на основе принципа лаконизма в

соответствии с требованиями настоящего стандарта.

По месту расположения в документе различают библиографи- ческие ссылки:

- внутритекстовые, помещенные в тексте документа;

- подстрочные, вынесенные из текста вниз полосы документа

(в сноску);

- затекстовые, вынесенные за текст документа или его части (в вы- носку).

При повторе ссылок на один и тот же объект различают библи- ографические ссылки:


- первичные, в которых библиографические сведения приводятся впервые в данном документе;

- повторные, в которых ранее указанные библиографические све- дения повторяют в сокращенной форме.

Сокращение отдельных слов и словосочетаний применяют для всех элементов библиографической записи, за исключением ос- новного заглавия документа. Слова и словосочетания сокращают

по ГОСТ 7.11 и ГОСТ 7.12.

 

Отсылки в тексте документа заключают в квадратные скобки. При необходимости отсылки могут содержать определенные иден- тифицирующие сведения: имя автора (авторов), название докумен- та, год издания, обозначение и номер тома, указание страниц. Эти сведения разделяются запятой:

Совокупность затекстовых библиографических ссылок офор- мляется как перечень библиографических записей, помещенный после текста документа или его составной части.

Затекстовая библиографическая ссылка может содержать сле- дующие элементы:

- заголовок;

- основное заглавие документа;

- общее обозначение материала;

- сведения, относящиеся к заглавию;

- сведения об ответственности;

- сведения об издании;

- выходные данные;

- физическую характеристику документа;

- сведения о местоположении объекта ссылки в документе (если ссылка на часть документа);

- сведения о серии;

- обозначение и порядковый номер тома или выпуска (для ссылок на публикации в многочастных или сериальных документах);

- сведения о документе, в котором опубликован объект ссылки;


- примечания;

- международный стандартный номер.

Выбор элементов из списка проводят исходя из принципа лако- низма – достаточности для поиска документа.

 

В затекстовой библиографической ссылке повторяют имею- щиеся в тексте документа библиографические сведения об объ- екте ссылки:

При нумерации затекстовых библиографических ссылок ис- пользуется сплошная нумерация для всего текста документа в целом или для отдельных глав, разделов, частей и т. п.. Для связи с текстом документа порядковый номер библиографической записи в затекстовой ссылке указывают в знаке выноски, который набира- ют на верхнюю линию шрифта, или в отсылке, которую приводят в квадратных скобках в строке с текстом документа.


 

Оформление ссылок также зависит от количества авторов. Если документ создан одним, двумя или тремя авторами, то в отсылке сначала указывают фамилии авторов, если на документ, созданный четырьмя и более авторами, а также, если авторы не указаны – сна- чала указывают название документа.

В отсылке допускается сокращать длинные заглавия, обозначая опускаемые слова многоточием с пробелом до и после этого пред- писанного знака.

Совокупность затекстовых библиографических ссылок офор- мляется как перечень библиографических записей, помещенный после текста документа или его составной части.

В ГОСТ Р 7.0.5–2008 указано, что «Совокупность затекстовых библиографических ссылок не является библиографическим спис- ком или указателем…». Следовательно, необходимо проявлять ос- мотрительность в выборе заголовка для перечня затекстовых ссы- лок. «Литература», «Список источников» и т. п.. оформляется по ГОСТ Р 7.0.5–2008 исходя из принципов лаконизма с приведением минимальной информации, достаточной для поиска документа, а

«Библиографический список» и «Библиографический указатель» требуют более развернутого и тщательного оформления по специа- лизированным ГОСТам (ГОСТ 7.1, ГОСТ 7.82, ГОСТ 7.80).


 

Объектами составления библиографической ссылки также яв- ляются электронные ресурсы локального и удаленного доступа. Ссылки составляют как на электронные ресурсы в целом (элект- ронные документы, базы данных, порталы, сайты, веб-страницы, форумы и т. д.), так и на составные части электронных ресурсов (разделы и части электронных документов, порталов, сайтов, веб- страниц, публикации в электронных сериальных изданиях, сооб- щениях на форумах и т. п.).

 

В примечании приводят сведения, необходимые для поиска и характеристики технических спецификаций электронного ресурса. Сведения приводят в следующей последовательности, системные требования, сведения об ограничении доступности, дату обновле- ния документа или его части, электронный адрес, дату обращения к документу.

 

Сведения о системных требованиях приводят в тех случаях, когда для открытия документа требуется специальное программное обес- печение (например, Adobe Acrobat Reader, MS PowerPoint и т. п.).

Примечание об ограничении доступности приводят в ссылках на документы из локальных сетей, а также из полнотекстовых баз


данных, доступ к которым осуществляется на договорной основе или по подписке (например, «Кодекс», «Гарант», «Консультант- Плюс», «EBSCO», «ProQuest», «Интегрум» и т. п.).

 

Для электронных ресурсов удаленного доступа приводят при- мечание о режиме доступа, в котором допускается использовать для обозначения электронного адреса аббревиатуру «URL» (Uniform Resource Locator – унифицированный указатель ресурса). Инфор- мацию о протоколе доступа к сетевому ресурсу (ftp, http и т. п.) и его электронный адрес приводят в формате унифицированного указа- теля ресурса. После электронного адреса в круглых скобках приво- дят сведения о дате обращения к электронному сетевому ресурсу, после слов «дата обращения» указывают число, месяц и год.

 

Контрольные вопросы

1. В чем удобство электронных библиотечных каталогов?

2. Какие каталоги существуют на сайте ГПНТБ?

3. Как организован поиск литературы в электронном каталоге ГПНТБ?

4. Какие существуют виды библиографических ссылок?

5. Как различаются правила оформления затекстовой ссылки в за- висимости от количества авторов?

6. В каких случаях применяется полное библиографическое опи- сание библиографических ссылок по ГОСТ 7.1, ГОСТ 7.82, ГОСТ 7.80?

7. «Библиографический список», «Библиографический указатель»,


«Список использованной литературы». Что из перечисленного оформляется по ГОСТ Р 7.0.5–2008?

8. Чем отличаются ссылки на электронные ресурсы локального и удаленного доступа?

9. Чем будет отличаться ссылка на один и тот же электронный до- кумент, приведенный в формате html и pdf?

10. Что необходимо указать при ссылке на электронный документ из информационных систем ограниченного доступа?

 

2.2. Порядок выполнения задания

1. Перед выполнением задания изучить п. 2.1 практикума и от- ветить на контрольные вопросы.

2. Открыть любой браузер. Войти в сеть библиотек России по адресу http://www.gpntb.ru, затем перейти по ссылке Электронные каталоги и базы данных (слева на странице). Переключиться в рас- ширенный вид поиска (справа на странице). Сделать запрос на по- иск литературы по ключевым словам при следующих условиях:

- формат выдачи результатов поиска – «полный формат»;

- тематика поиска – по теме исследования;

- ключевые слова – 2–3 значимых слова из названия исследова- тельской работы;

- глубина поиска по году издания – 5 лет.

3. После осуществления поиска выбрать формат представления найденных документов «информационный» и отсортировать вы- борку по году издания (данные возможности находятся в виде соот- ветствующих ссылок и находятся выше перечня найденной литера- туры). Выбрать не менее 20 литературных источников (2 за каждый год издания). Полученную выборку сохранить в файле «литература. doc», создав и заполнив таблицу следующего вида:

 

Автор(ы) Заглавие Выходные данные Количественные характеристики Серия ISBN
           

 

Перед таблицей укажите условия вашего поиска (см. п. 2).


4. На основе полученной информации, используя Интернет и собственные наработки (если таких данных не будет в таблице), со- ставить затекстовые библиографические ссылки и представить их в виде нумерованного списка, поместив его ниже таблицы. В этом списке должны быть представлены источники следующих типов:

- монография одного автора;

- монография трех авторов;

- монография четырех и более авторов;

- справочник;

- статья в журнале;

- статья в pdf-формате, опубликованная в Интернете;

- сообщение на форуме;

- диссертация в электронном виде.

 

2.3. Требования к оформлению, процедура защиты

Отчет о данной работе должен содержать титульный лист, цель работы, таблицу с литературой, оформленный библиографический список, выводы. При защите необходимо дать требуемые поясне- ния к содержанию отчета и ответить на контрольный вопрос. До- пускается представление отчета в электронном виде в редакторе MS Word.


Практическая работа 3


Дата добавления: 2021-02-10; просмотров: 412; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!