Тематические поисковые системы и ресурсы



Лабораторная работа №1. «Ресурсы и сервисы Интернета. Поиск информации»

Теоретическая часть

Существует три основных объекта поиска, которые можно получить из сети Интернет:

1. Файлы (например, мы хотим найти какую-то программу или драйвер, точно зная, как называется файл). В этом случае полезно задать само имя файла в строке поиска (в обычном поисковике или специальном, об этом будет сказано ниже).

2. Серверы (например, если мы хотим ознакомиться с прейскурантом какой-либо фирмы, или хотим сравнить деятельность нескольких организаций). В этом случае полезно обратиться к услугам каталогизаторов – специальных серверов, содержащих базы данных, в которых указана тематика сайтов, хранятся ссылки на их главные страницы, названия владельцев, ключевые слова. Каталогизаторы также могут быть специализированные (например, http://list.ru/ - универсальный каталог сайтов системы Мэйл.Ру, http://driver.ru/ - каталог для поиска драйверов).

3. Информация вообще (аудио и видео, изображения, тексты художественных произведений, научные статьи на заданную тему, биографии,  учебные пособия, презентации и т. п.). Универсальным средством поиска любой информации сегодня явлются поисковые системы, подробнее о них рассказано ниже.

Веб-страница (от англ. web “сеть”) – это находящийся в Интернете документ, обычно содержащий какую-то информацию и ссылки на другие информационные ресурсы. Каждая веб-страница имеет свой адрес.

Браузер – это программа-обозреватель, предназначенная для просмотра веб- страниц.

Гипертекст – это текст, написанный с помощью специального языка разметки веб-страниц (HTML – hypertext mark-up language) и содержащий специальные метки, теги, которые обрабатываеются браузером. С помощью тегов и других средств разметки браузер получает инструкции – как структурировать содержимое веб-страницы, как именно отображать её дизайн, как встраивать в текст ссылки, картинки, видео и т.п.

URL -адрес (англ. Uniform Resource Licator “единообразный определитель местонахождения ресурса”) определяет расположение веб-страницы в Интернете с использованием специальных правил. URL состоит из трех частей:

· протокол;

· доменное имя узла;

· путь.

Протокол – это набор правил и действий (очерёдности действий), позволяющий осуществлять соединение и обмен данными между двумя и более включёнными в сеть устройствами. Например, HTTP - это протокол передачи гипертекста, он используется при пересылке веб-страниц с одного компьютера на другой; FTP – протокол передачи файлов.

Доменное имя узла определяет сервер, на котором постоянно находится данная страница, например, www.mail.ru – доменное имя узла.

Путь – последовательность вложенных папок на сервере, в последней из которых располагается файл веб-документа.

Пример:

http://www.host.com/files/are/here.html

         
 


протокол доменное имя         полный путь    

Самый простой способ открыть веб-страницу – задать ее URL-адрес в адресной строке браузера и нажать Enter :

Поисковые машины

Поисковая машина (англ. search engine) это расположенная на специальном сервере поисковая система, которая постоянно работает с поисковой базой данных, включая новую и обновляя существующую информацию о различных информационных ресурсах Интернета.

Все поисковые машины имеют схожие принципы работы. Поиск проводится по запросу, составляемому пользователем, состоящему из набора ключевых слов. Возможен также поиск по ключевым объектам (например, картинкам).

Индекс – это упорядоченный список связей между объектами поиска и местами, где можно обнаружить эти объекты. Примерами индексов являются оглавление и алфавитный указатель в обычной книге.Важно понимать, что все поисковые системы Интернета являются индексирующими, т.е. они выполняют поиск только в своей базе данных, которую формирует поисковый робот - его также называют индексатором, пауком (кроулер) или просто ботом. Одновременно работает много ботов поисковой системы.Индекс поисковой системы - это база данных, в которой установлены связи между объектами поиска (например, словами) и адресами веб-страниц, где эти объекты присутствуют. Процесс обработки веб-страницы и её добавления в индекс называется, индексированием. Ключевым словом (keyword) называется отдельное слово или фраза, которые отражают содержимое (контент) нужного пользователю документа.

Правила составления запросов

Наиболее популярные системыдля поиска информации сегодня – это Яндекс http://www.yandex.ru (в основном им пользуются только в России) и Google http://www.google.com.   Обе эти системы работают с 90-х годов и всё время совершенствуются.

Поисковые системы хорошо «понимают» запросы из нескольких слов и способны их интерпретировать, т.е. «знают», в каких случаях надо искать страницы, в которых слова запроса расположены рядом, а когда достаточно словам встретиться в одном документе, чтобы страница соответствовала запросу. Также современные поисковые системы способны исправлять орфографические и пунктуационные ошибки в запросах, регистр символов (т.е. большие буквы или маленькие) в запросе не учитывается, если не оговорено особо. Возможен также поиск изображений по образцу.

В то же время специализированную информацию, например, учебно-методическую или научную, бывает найти существенно сложнее. Поэтому следует знать основные расширенные возможности поисковых систем, позволяющие сделать поиск более подробным.   

Поиск в Яндексе

Если результаты простого поиска, по ключевым словам, по каким-то причинам неудовлетворительны, можно перейти к расширенному поиску, нажав соответствующую ссылку:

Поисковик перейдет к форме, с помощью которой можно задать детали поиска:

В этой форме можно, например, задать, в пределах какого сайта осуществлять поиск, учитывать изменение форм слов или нет, можно указать срок давности, формат файлов, в которых искать информацию, и др.

Еще более подробный поиск можно осуществить заранее, используя язык запросов Яндекса. Некоторые примеры использования операторов запросов Яндекса:

Оператор Название, описание Пример
" " Кавычки – используйте для поиска документов, содержащих в точности указанную фразу  По запросу "Алексей Толстой" будут найдены страницы, где есть подряд два слова: вначале «Алексей», затем «Толстой» именно в такой форме.
* Джокер – используйте совместно с " "  для указания на некоторое пропущенное слово Запрос "российская * политика" вернет страницы, содержащие слова «российская военная политика», «российская внешняя политика» и т.д.
! Используйте перед словом восклицательный знак, чтобы отменить поиск всех форм, кроме заданной вами Запрос со словом !дня вернет страницы, где есть слово «дня» именно в такой форме, а не «день» или «дню»
& Амперсанд используется для указания на то, что искомые слова должны находиться в пределах одного предложения – независимо от формы слов На запрос айфон & любить будут выданы страницы, содержащие фразы «какие из айфонов любят в России», «я не люблю айфоны» и т.п.
- Поместите слово или слова, которое вы не хотите видеть в ответах, в конец поискового запроса и поставьте впереди минус, не отделяя его пробелом Запрос толстой -лев -николаевич -"л.н." выдаст страницы, где слово «Толстой» (в той или иной форме) присутствует, но нет указанных с минусами слов
| Прямой слеш используется для поиска по любому из слов, что удобно, например, для поиска синонимов и близких понятий По запросу дирижабль | аэростат будут выданы ссылки на страницы, содержащие любое из этих слов
title: Используется для поиска в специальной области веб-страниц – в заголовке (title), который отображается на ярлычке окна или вкладки браузера По запросу title:(повышение тарифов на газ украина) будут найдены страницы, где указанные слова присутствуют в заголовке  
site: Применяется для поиска на конкретном сайте или сайтах Запрос шолохов site:http://www.lib.ru/ ищет страницы со словом «Шолохов» (в той или иной форме) только на сайте www.lib.ru
date: Применяется для указания даты или диапазона дат, когда веб-страница была размещена в Интернете Запрос путин date:<20190101 ищет страницы со словом «Путин», размещенные ранее 1 января 2019 г. Запрос обама date:20150501..20190101 ищет страницы со словом «Обама», размещенные с 1 мая 2015 г. по 1 января 2019 г. Запрос лукашенко date:201907* ищет страницы со словом «Лукашенко», размещенные в июле 2019 г.

Естественно, различные операторы можно комбинировать в одном запросе. Подробно язык запросов Яндекса описан в данной ссылке.

Поиск в Google

Google является более развитой и интеллектуальной системой (например, в нем доступен голосовой поиск, а на мобильных устройствах также доступен поиск информации об объекте по его фотографии – приложение Goggles).

Информационный раздел под названием «Формула поиска», где рассказывается об алгоритмах поиска Google, индексировании и приведены различные рекомендации, находится здесь.

Более подробный поиск работает так же, как в Яндексе: после ввода запроса доступно меню настроек. Так же, как в Яндексе, можно выбрать тематический поиск, т.е. поиск картинок, видео и т.д. Наиболее популярные опции поиска, такие как дата, язык, месторасположение, можно настроить здесь же, в меню.

Расширенный поиск – опять же, как и в Яндексе, ­– можно настроить, перейдя на специальную форму:

Расширенный поиск здесь настраивается похожим образом – можно выбрать поиск, по нескольким словам, исключить какие-то слова из поиска, указать место искомых слов на странице; можно организовать поиск на определенном сайте, в определенной доменной зоне; можно указать нужный диапазон дат обновления веб-страниц и т.д.

В Google также есть свой язык запросов, используя который при вводе запроса, можно заранее указать точные параметры интересующих пользователя страниц. Вот некоторые примеры:

Оператор Описание Пример
" " Чтобы выполнить поиск по точному слову или фразе, заключите их в кавычки. С помощью точных запросов легко найти, тексты песен и цитаты из книг. Используйте только если точно знаете нужное слово или фразу. "и снится нам не рокот космодрома"
- Добавьте в запрос слово со знаком минус (-), чтобы исключить результаты, в которых оно встречается. Это удобно, например, если у ключевого слова есть несколько значений (например, ягуар – марка автомобиля и животное). Знак минуса можно использовать вместе с другими операторами. Например, поставьте его перед оператором site: (без пробела), чтобы исключить веб-ресурс, указанный после двоеточия, из результатов поиска.     ягуар скорость -авто   панда -site:wikipedia.org  
~ Чтобы найти сайты, содержащие синонимы определенного слова, поставьте перед ним знак "~". Если ввести ~блины, можно найти информацию также об оладьях, блинчиках и т.п.
* Звездочка (*) является подстановочным знаком и заменяет любое неизвестное ключевое слово в запросе. Ее можно использовать в комбинации с кавычками для поиска вариантов определенной фразы. Это удобно, например, когда нужно найти выражение, которое вы не помните точно. "делу *, потехе *"
OR Если надо найти результаты, содержащие хотя бы одно из нескольких слов, поставьте между ними оператор OR (пишется заглавными буквами). Результаты же поиска по запросу без этого оператора содержат оба термина. Чтобы найти результаты с точными фразами, заключите их в кавычки. олимпийские игры 2014 OR 2018     "olympic games 2014" OR "olympic games 2018"
.. Чтобы найти страницы, содержащие число из заданного диапазона, разделите первое и последнее число диапазона двумя точками без пробелов (..). Чтобы указать только максимальное или минимальное значение диапазона, поставьте две точки перед числом либо после него. фотоаппарат nikon 12000..18000 руб   победители tour de france ..2000
site: Чтобы ограничить область поиска определенным сайтом, примените в запросе оператор site:. Область поиска также можно ограничить доменами верхнего уровня (например, .org, .edu, .gov) или доменами определенных стран (например, .ru, .de, .jp). олимпийские игры site:ria.ru   олимпиада 2014 site:.ua
link: С помощью оператора link: можно найти страницы, на которых размещена определенная ссылка. Таким бразом можно искать ссылки на сайты или отдельные веб-страницы сайтов. Чтобы найти страницы, ссылающиеся на сайт ТГПУ им.Толстого, можно использовать такой запрос: link:tsput.ru А следующий запрос найдет страницы, ссылающиеся на раздел сайта, посвященный приемной кампании: link:tsput.ru/ent/2013/
related: Для поиска веб-страниц схожего содержания используйте оператор related:. Зная адрес сайта Президента РФ, можно найти схожие сайты: related:kremlin.ru

Тематические поисковые системы и ресурсы

Как уже говорилось выше, в Яндексе и в Google есть возможность применить тематический поиск, т.е. поиск объектов определенного типа – книг, видео, музыки и т.п. Горизонтальное меню поиска в обеих системах доступно на главной странице. Например, в Яндексе при нажатии на ссылку «Видео», осуществляется перевод пользователя в специальную подсистему:

Существует также большое число серверов, хранящих специфическую информацию и снабженных внутренним поиском. Многие из них предоставляют услуги хостинга, т.е. загрузки и хранения информации, размещенной пользователем, и доступа к ней по Интернету для других пользователей.

Значительная часть этих ресурсов имеет развлекательный хзарактер. В качестве примеров можно указать всем известный видео-хостинг YouTube и русскоязычный сервер mp3-музыки Зайцев.Нет.

При подготовке к экзаменам, а также при написании рефератов и курсовых работ вам, возможно, пригодятся следующие ресурсы.

Library Genesis , сайт https://libgen.is, - электронная библиотека учебной, научной и художественной литературы на разных языках. На главной странице расположена удобная форма, где можно указать параметры искомой книги или публикации (автор, год издания, область знаний и др.):  

Результаты поиска выводятся в виде ссылок с указанием типа файла и его размера. Нажав на ссылку, можно сохранить (скачать) нужный файл.

eLIBRARY.RU - научная электронная библиотека, крупнейший российский информационный портал в области науки, технологии, медицины и образования, содержащий рефераты и полные тексты более 18 млн научных статей и публикаций. На её платформе также доступны электронные версии более 2000 российских научных журналов (в открытом доступе). На главной странице сайта есть ссылка на форму расширенного поиска, где можно настроить различные параметры поиска:


Дата добавления: 2020-01-07; просмотров: 355; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!