Что значит метапоиск? Какие системы позволяют осуществлять метапоиск?



В чем различие между поисковыми системами типа «индекс» и «каталог»? Кратко: информация в каталоге ограничена тем, что в него забили. а поисковая система рыщет по всем доступным на данный момент ресурсам, в т.ч. другим каталогам. но в отл. от каталога- п.с. может предлагать приблизительные возможные сочетания из данных в запросе. поисковик-шире, но требуется зерна от плевел отделять самостоятельно. Поиско́вая систе́ма (англ. search engine) — это компьютерная система, предназначенная для поиска информации. Одно из наиболее известных применений поисковых систем — веб-сервисы для поиска текстовой или графической информации во Всемирной паутине. Существуют также системы, способные искать файлы на FTP-серверах, товары в интернет-магазинах, информацию в группах новостей Usenet. Для поиска информации с помощью поисковой системы пользователь формулирует поисковый запрос. Работа поисковой системы заключается в том, чтобы по запросу пользователя найти документы, содержащие либо указанные ключевые слова, либо слова, как-либо связанные с ключевыми словами. При этом поисковая система генерирует страницу результатов поиска. Такая поисковая выдача может содержать различные типы результатов, например: веб-страницы, изображения, аудиофайлы. Некоторые поисковые системы также извлекают информацию из подходящих баз данных и каталогов ресурсов в Интернете. Поиско́вый и́ндекс — структура данных, которая содержит информацию о документах и используется в поисковых системах. Индекси́рование[⇨], совершаемое поисковой машиной, — процесс сбора, сортировки и хранения данных с целью обеспечить быстрый и точный поиск информации. Создание индекса включает междисциплинарные понятия из лингвистики, когнитивной психологии, математики, информатики и физики. Веб-индексированием называют процесс индексирования в контексте поисковых машин, разработанных, чтобы искать веб-страницы в Интернете. Популярные поисковые машины сосредотачиваются на полнотекстовой индексации документов, написанных на естественных языках[1][⇨]. Мультимедийные документы, такие как видео и аудио[2] и графика[3][4], также могут участвовать в поиске. Метапоисковые машины используют индексы других поисковых сервисов и не хранят локальный индекс, в то время как поисковые машины, основанные на кешированных страницах, долго хранят как индекс, так и текстовые корпусы. В отличие от полнотекстовых индексов, частично-текстовые сервисы ограничивают глубину индексации, чтобы уменьшить размер индекса. Большие сервисы, как правило, выполняют индексацию в заданном временно́м интервале из-за необходимого времени и затрат на обработку, в то время как поисковые машины, основанные на агентах, строят индекс в масштабе реального времени. Индексация Цель использования индекса — повышение скорости поиска релевантных документов по поисковому запросу. Без индекса поисковая машина должна была бы сканировать каждый документ в корпусе, что потребовало бы большого количества времени и вычислительной мощности. Например, в то время, как индекс 10 000 документов может быть опрошен в пределах миллисекунд, последовательный просмотр каждого слова в 10 000 больших документов мог бы занять часы. Дополнительная память, выделяемая для хранения индекса, и увеличение времени, требуемое для обновления индекса, компенсируется уменьшением времени на поиск информации. Катало́г сайтов Интернета, или каталог Интернет-ресурсов, или просто Интернет-каталог (англ. web directory) — структурированный набор ссылок на сайты с кратким их описанием. Сайты внутри каталога разбиваются по темам, а внутри тем могут быть ранжированы или по индексу цитирования (как в каталогах Яндекса или Google[1]), или по дате добавления, или по алфавиту, или по другому параметру. Это один из старейших сервисов Интернета. Подавляющее большинство рейтингов посещаемости ресурсов имеют классификатор сайтов, но ранжирование всегда основано на посещаемости сайтов. В зависимости от широты тематики ссылок каталоги могут быть общими и специализированными (тематическими). * Поисковые инструменты можно разделить на: -1 каталоги или директории - directories – 2 поисковые системы - search engines. В основу этой классификации положен принцип отбора и обработки информации для базы данных поискового инструмента, а именно: насколько этот процесс автоматизирован, кто создает базу данных поискового инструмента: люди или компьютеры. * В последнее время разница между поисковыми системами и директориями «стирается», поскольку их создатели стараются не акцентировать внимание пользователей на принципах отбора информации, а представляют как можно больше схожих сервисных возможностей, работая как универсальные порталы. Но разница в отборе и обработке информации все-таки остается существенно важной и определяющей: – поисковые машины используют машины-роботы для поиска, индексации информации – т.е. Процесс полностью автоматизирован; - директории построены на том, что сайт «дожидается» быть принятым, обработанным и описанным неким специалистом-каталогизатором. * Такие отличные друг от друга принципы работы поисковых систем и директорий значительно влияют на их объем и содержание, а соответственно – и на стратегию поиска: Поисковые системы индексируют содержимое того или иного сайта полностью и поиск ведется по всем его полным текстам. Директории представляют тот или иной сайт в общих чертах – каталогизатор аннотирует и систематизирует сайт в соответствии с его общим содержанием и полные тексты не индексируются. Поисковые системы индексируют большое количество сайтов, поскольку роботы, «просматривающие» содержимое Сети действуют по принципу «снежного кома», путешествуя от ссылки к ссылке. Директории же отличаются осмысленностью и упорядоченностью подбора сайтов в свои базы данных (обычно это информационно насыщенные и/или сайты крупных физических объектов). * Итак, некоторые поисковые системы: Altavista (www.altavista.com) Яndex (www.yandex.ru) Google (www.google.com) Rambler (www.rambler.ru) FastSearch (www.alltheweb.com) * И директории (или каталоги): Yahoo (www.yahoo.com) Librarians’ Index to the Internet (lii.org) List.ru (www.list.ru * * Для того, чтобы правильно построить стратегию поиска, нужно прежде всего решить для себя какого рода информацию вы хотите получить – некую общую, описывающую объект или явление в целом, или же какие-то детали, частности, которые могут встретиться в полном тексте какого-то документа. В первом случае – целесообразно использовать директорию, во втором – поисковую систему. Если же, начиная поиск, вы еще не представляете точно, что и как много вы хотите получить в результатах запроса рекомендуется использовать разные поисковые инструменты в комплексе.

Что значит метапоиск? Какие системы позволяют осуществлять метапоиск?

Метапоиск — это поисковая машина, которая при поисковом запросе параллельно опрашивает несколько независимых традиционных ПС и возвращает их результаты одним, объединенным списком результатов без дублирования ссылок и, по возможности, улучшая частные результаты выдачи, т.е. выступая посредником между вами и множеством ведущих ПС. (поисковые системы (ПС))

Преимущества метапоиска

Главное преимущество — это возможность быстро и удобно сделать запрос фактически через одну поисковую строку сразу ко многим ведущим ПС, что экономит время, да и анализ единого листинга результатов намного проще, чем сличение множества разных листингов с множеством дублирований результатов. Иначе говоря, работая через метапоиск, ваш угол обзора всегда будет существенно шире, чем через каждую ПС в отдельности.

Недостатки метапоиска

Недостатки метапоиска являются продолжением и логическим следствием его преимуществ: так, очевидно, что у метапоиска отсутствует собственная индексная база, соответственно вы не можете добавлять в его поиск URL своих сайтов. Второй очень важный недостаток такого поиска, это традиционные очень скромные синтаксические возможности для формулирования условий расширенного поиска. Поскольку метапоисковик может использовать в качестве доноров до 15-20 сторонних поисковых машин, то очевидно, что синтаксис расширенного поиска (булевы операции и т.п.) у всех поисковиков так или иначе будут отличаться. И хотя некоторые продвинутые метапоисковики «Новой Школы» (см.описание ниже) и пытаются на лету транслировать подобные сложные запросы в персональный язык каждой отдельной ПС, пока это ещё редкость, и в целом поддержка разновидностей булевых и других расширенных операций пока в метапоиске очень ограничена.

Разновидности метапоиска

Наиболее стандартный тип метапоиска это ПС, обеспечивающая параллельный запрос во множество обычных ПС с последующей выдачей результата этих поисков в одной общей странице исходного метапоиска. Но кроме этого вида существуют и другие разновидности, в частности, варианты, когда результаты запроса подгружаются во фреймах в пределах одной страницы, причем в каждом фрейме отображается оригинальная страница с результатами целевой ПС, также возможен вариант открытия после запроса нескольких страниц с оригинальной выдачей на ваш запрос каждой подключенной ПС. Ещё один распространенный вариант — это наличие формы поиска, в которой вы можете обращаться к огромному количеству ПС, но здесь есть возможность выполнить за раз запрос только к одной ПС на выбор, это так называемые поисковые страницы «все в одном» (all-in-one search).

Наиболее популярные метапоисковики

Переходя от абстрактного описания к конкретике, на март 2011 года лидирующим по количеству посещений был метапоиск WebCrawler c более чем 12 миллионов уникальных посетителей в месяц.

5. Назовите два преимущества просмотра веб-страниц по ссылке Cached.

Одной из популярных операционных систем сегодня является Android. Она установлена на миллионах мобильных устройств. Система представляет собой набор папок и файлов, которые обеспечивают ее работу. Cached – это папка для хранения и просматривания временных файлов. Основным приемуществои Cached является:

1. Скорость доступа процессора к оперативной памяти. Она в сотни и более раз больше, чем к памяти внешних накопителей. Cached внешних устройств хранения значительно увеличивает производительность системы за счёт оптимизации использования ввода-вывода. Преимуществом технологии является прозрачная (незаметная для программ) автоматическая оптимизация использования памяти-дисков при неизменности логики приложений, работающих с файлами.

2. Производительность дисковых устройств хранения (жесткие, гибкие, оптические диски) максимальна при чтении-записи нескольких последовательно расположенных блоков и значительно уменьшается при одиночных запросах в разные места диска, что связано с инерцией механического привода головки. При чтении Cached позволяет прочитать блок один раз, затем хранить одну копию блока в оперативной памяти для всех процессов и выдавать содержимое блока «мгновенно» (по сравнению с запросом к диску). Существующая техника «предзапроса» — в фоновом режиме операционной системой считываются в Cached также несколько следующих блоков (после нужного). При записи Cached позволяет сгруппировать короткие записи в более крупные, которые эффективнее обрабатываются накопителями, либо избежать записи промежуточных модификаций. При этом все промежуточные состояния блока видны процессам из оперативной памяти.

Cached внешних устройств хранения значительно увеличивает производительность системы за счёт оптимизации использования ввода-вывода. Преимуществом технологии является прозрачная (незаметная для программ) автоматическая оптимизация использования памяти-дисков при неизменности логики приложений, работающих с файлами.

6.

7.  Какие результаты выдаст поисковая система Google по следующим запросам:

- “will * a project”-intitle:”feed pumps”-intitle:”feedpumps” boilers?

Скрины:

8.

9.

10.


Дата добавления: 2018-08-06; просмотров: 339; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!