Поиск в Интернете: общие понятия



 

В первую очередь определимся со средствами поиска информации в Интернете. По принципу организации и использования их можно разделить на поисковые каталоги (справочники, директории) и поисковые машины.

 

Каталоги веб‑страниц

 

Поисковые каталоги напоминают систематические каталоги обычных библиотек. Каталоги – это электронные справочники, в которых собраны списки адресов интернет‑страниц, сгруппированные по определенным признакам, чаще всего – по тематике. Обычно каталоги веб‑страниц бывают многоуровневыми, каждая тема в них разбивается на несколько тем более частного характера. Верхний уровень представляет собой общую категорию, например «бизнес», «наука», «искусство», а элементы самого низкого уровня – это ссылки на отдельные страницы и серверы вместе с кратким описанием их содержимого.

Процедура поиска нужного сайта в каталогах состоит в последовательном переходе от одного уровня к другому. Таким образом, последовательно уточняя тематику поиска, можно, продвигаясь по каталогу, дойти до самых нижних ступеней иерархии и получить, наконец, нужный список сайтов. Каталоги чаще всего используются в тех случаях, когда необходимо получить набор сайтов по какой‑то определенной проблеме. В каталогах отображены самые популярные ресурсы, относящиеся к одной теме, которые, кроме всего прочего, отсортированы в порядке значимости.

Наиболее популярными и серьезными каталогами считаются следующие: www.mail.ru (list.mail.ru), каталог поисковой системы «Яндекс» (yaca.Яндекс. ru), weblist.ru, www.vsego.ru, www.myweb.ru. Среди англоязычных ресурсов наиболее популярным является каталог Yahoo! (www.yahoo.com). Самым авторитетным в мире каталогом веб‑страниц признан открытый каталог dmoz.org.

Главное преимущество поисковых каталогов заключается в том, что информация в них хранится упорядоченно, в соответствии с элементарной логикой.

 

Примечание

С помощью каталога нецелесообразно проводить поиск информации по узконаправленной тематике: в нем может просто не оказаться нужной рубрики, а на просмотр похожих разделов может уйти много времени.

 

Однако у поисковых каталогов существует множество недостатков. Например, в них могут отсутствовать некоторые ссылки: из‑за того, что редакторы создают каталоги вручную, количество ссылок в них ограничено, более того, самые интересные из них могут не попадать в каталог, так как редакторы физически не успевают их вносить. Как результат – обновление происходит медленно.

Неоднозначность структуры – это еще один явный минус каталожной организации информации (хотя отчасти он нейтрализуется тем, что в каждом крупном каталоге существует своя система поиска).

 

Поисковые машины

 

Если вам необходимо получить подборку материалов по более конкретной и специальной информации, лучше воспользоваться поисковыми машинами. Поисковая машина – это комплекс специальных программ для поиска в Сети. Они лишены недостатков, присущих каталогам, и работают немного по‑другому. Поиск с помощью поисковых машин происходит намного быстрее, кроме того, такие системы могут искать среди гораздо большего количества сайтов – область поиска в этом случае практически неограниченна.

Принцип действия поисковых машин заключается в постоянном последовательном исследовании всех веб‑страниц. Из‑за необходимости постоянного обновления информации время от времени машины возвращаются к просмотренным ранее сайтам, чтобы найти и зарегистрировать возникшие там изменения. Вся прочитанная информация индексируется, то есть создается специализированная база данных, в которой сохраяются просмотренные поисковиком веб‑страницы. Там и осуществляется поиск. Эту базу данных наполняют специальные программы‑роботы, которые, просматривая сайты, обращают внимание на некоторые дополнительные элементы. Например, на частоту употребления слова на странице, на его выделение, а также количество ссылок на данный документ на других сайтах. Поисковые машины проводят поиск по заданному пользователем поисковому запросу – специальной фразе или набору слов, которые выражают суть того, что нужно найти.

Кроме этого, с каждой веб‑страницей связан набор ключевых слов. Эти слова лучше всего описывают ее содержимое. При поиске информации поисковые машины в первую очередь анализируют их совпадение со словами из поискового запроса.

Таким образом, поиск с помощью поисковых машин состоит в просмотре базы данных веб‑страниц и розыске тех из них, которые соответствуют запросу.

 

Примечание

Большинство современных поисковых систем совмещают в себе и тематический каталог, и возможности поисковой машины.

 

Интерфейс всех поисковых систем построен примерно одинаково. Пользователю предлагается ввести запрос в специальное поле, а затем запустить поиск щелчком на кнопке Найти или Поиск. Система произведет поиск и выдаст результаты в окне браузера. Однако несмотря на общие принципы работы и похожий интерфейс, поисковые машины отличаются между собой целым рядом параметров. Среди них – релевантность результатов, величина и частота обновления баз данных, скорость выдачи результатов и удобство работы.

Наряду с этим существуют и другие различия – языки запроса, зоны поиска, глубина поиска внутри документов, методы определения приоритетов, поэтому применение разных поисковых машин дает различные результаты.

Наиболее популярными поисковыми машинами являются следующие: www.yandex.ru, www.rambler.ru, www.google.com, www.aport.ru, www.mail.ru, www.alltheweb.com, www.yahoo.com, www.lycos.com.

За время существования поисковых машин выработался определенный стандарт предоставления пользователю страницы с результатами поиска. Поэтому, разобравшись в форме выдачи результатов хотя бы одной поисковой машины, можно уверенно пользоваться остальными.

Страница с результатами поиска, полученными с помощью поисковой машины, содержит следующие элементы:

• заголовок найденной страницы;

• цитату из текста страницы, по которой видно, в каком контексте используются слова поискового запроса; искомые слова в цитате, как правило, выделены полужирным шрифтом или отличаются по цвету от основного текста;

• полный адрес страницы;

• размер страницы, дату последнего изменения.

В некоторых случаях в списке ссылок доступна возможность просмотра похожих документов. Отдельные поисковики анализируют содержание найденных по запросу страниц и группируют их по своим особым, внутренним критериям. Например, по близости словарей страниц, по одинаковым заголовкам, по совпадениям фраз, по количеству синонимов.

Кроме того, в некоторых случаях в результатах поиска можно увидеть рубрику веб‑каталога, к которой относится найденный сайт (если последний участвует в каталоге или рейтинге).

 


Дата добавления: 2018-09-22; просмотров: 242; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!