Информационно-поисковые системы Интернета

Лекция 5 по ИСЭ. Понятие АИС и их классификация

Автоматизированная информационная система — совокупность информации, ЭММ и моделей, технических, программных, технологических средств и специалистов, предназначенную для обработки информации и принятия управленческих решений.

Структура АИС

1. Информационные технологии (ИТ) – инфраструктура, обеспечивающая реализацию информационных процессов сбора, обработки, накопления, хранения, поиска и распространения информации. ИТ предназначены для снижения трудоемкости процессов использования информационных ресурсов, повышения их надежности и оперативности.

2. Функциональные подсистемы и приложения – специализированные программы, предназначенные обеспечить обработку и анализ информации для целей подготовки документов, принятия решений в конкретной функциональной области на базе ИТ.

3. Управление ИС – компонент, который обеспечивает оптимальное взаимодействие ИТ, функциональных подсистем и связанных с ними специалистов, развитие их в течение жизненного цикла ИС.

Классификация АИС

По видам процессов управления:

1. АИС управления технологическими процессами

2. АИС организационного управления

3. АИС управления организационно-технологическими процессами

4. АИС научных исследований

5. АИС обучающие

По сфере функционирования объекта управления бывают: АИС банков, АИС финансовых органов, АИС промышленности, АИС сельского хозяйства, АИС связи, АИС статистики и т.п.

По уровню в системе государственного управления бывают отраслевые АИС (промышленный комплекс, агропромышленный комплекс, строительство и транспорт), территориальные АИС (предназначены для управления административно-территориальными районами) и межотраслевые АИС.

Кроме того различают производственные и непроизводственные АИС (в медицине, милиции и пр.).

Глобальная сеть Интернет, история возникновения и развития

Интернет — всемирная система объединённых компьютерных сетей, построенная на базе протокола IP и маршрутизации IP-пакетов. Интернет образует глобальное информационное пространство, служит физической основой для Всемирной паутины и множества других систем (протоколов) передачи данных. В настоящее время под словом «Интернет» чаще всего имеется в виду Всемирная паутина и доступная в ней информация, а не физическая сеть. К концу 2011 года число пользователей, регулярно использующих Интернет, составило около 2,3 млрд человек. История В 1957 Министерство обороны США посчитало, что на случай войны Америке нужна надёжная система передачи информации. Агенство по перспективным научно-исследовательским разработкам США предложило разработать для этого компьютерную сеть,которая была названа ARPANET, и в 1969 году в рамках проекта сеть объединила четыре указанных научных учреждения. Все работы финансировались Министерством обороны США. Затем сеть ARPANET начала активно расти и развиваться, её начали использовать учёные из разных областей науки. Первый сервер ARPANET был установлен 2 сентября 1969 в Калифорнийском университете (Лос-Анджелес). Компьютер Honeywell DP-516 имел 24 Кб оперативной памяти. 29 октября в 21:00 между двумя первыми узлами сети ARPANET, находящимися на расстоянии в 640 км — в Калифорнийском университете Лос-Анджелеса (UCLA) и в Стэнфордском исследовательском институте (SRI) — провели сеанс связи. Чарли Клайн (Charley Kline) пытался выполнить удалённое подключение из Лос-Анджелеса к компьютеру в Стэнфорде. Успешную передачу каждого введённого символа его коллега Билл Дювалль (Bill Duvall) из Стэнфорда подтверждал по телефону. В первый раз удалось отправить всего три символа «LOG», после чего сеть перестала функционировать. LOG должно было быть словом LOGIN(команда входа в систему). В рабочее состояние систему вернули уже к 22:30 и следующая попытка оказалась успешной. Именно эту дату можно считать днём рождения Интернета. К 1971 году была разработана первая программа для отправки электронной почты по сети. Эта программа сразу стала очень популярна. В 1973 году к сети были подключены через трансатлантический телефонный кабель первые иностранные организации из Великобритании и Норвегии, сеть стала международной. В 70-ых годах сеть в основном использовалась для пересылки электронной почты, тогда же появились первые списки почтовой рассылки, новостные группы и доски объявлений. К концу 1970-х годов начали бурно развиваться протоколы передачи данных. Активную роль в разработке и стандартизации сетевых протоколов играл ДжонПостел. 1 января 1983 года сеть ARPANET перешла с протокола NCP на TCP/IP, который успешно применяется до сих пор для объединения сетей. Именно в 1983 году термин «Интернет» закрепился за сетью ARPANET. В 1984 году была разработана система доменных имен. В 1984 году у сети ARPANET появился серьёзный соперник: Национальный научный фонд США (NSF) основал обширную меж университетскую сеть National Science Foundation Network, которая была составлена из более мелких сетей и имела гораздо большую пропускную способность, чем ARPANET. К этой сети за год подключились около 10 тыс. компьютеров, название «Интернет» начало плавно переходить к NSFNet. Концепцию Всемирной паутины предложил знаменитый британский учёный Тим Бернерс-Ли, он же в течение двух лет разработал протокол HTTP, язык HTML и идентификаторы URI. В 1990 году сеть ARPANET прекратила своё существование, полностью проиграв конкуренцию NSFNet. В том же году было зафиксировано первое подключение к Интернету по телефонной линии. В 1991 году Всемирная паутина стала общедоступна в Интернете, а в 1993 году появился знаменитый веб-браузер NCSA Mosaic. Всемирная паутина набирала популярность. В 1995 году NSFet вернулась к роли исследовательской сети, маршрутизацией всего трафика Интернета теперь занимались сетевые провайдеры, а не супер компьютеры Национального научного фонда. В том же 1995 году Всемирная паутина стала основным поставщиком информации в Интернете, обогнав по трафику протокол пересылки файлов FTP. Можно сказать, что Всемирная паутина преобразила Интернет и создала его современный облик. С 1996 года Всемирная паутина почти полностью подменяет собой понятие «Интернет».   В 1990-е годы Интернет объединил в себе большинство существовавших тогда сетей. Объединение выглядело привлекательным благодаря отсутствию единого руководства, а также благодаря открытости технических стандартов Интернета, что делало сети независимыми от бизнеса и конкретных компаний. К 1997 году в Интернете насчитывалось уже около 10 млн компьютеров, было зарегистрировано более 1 млн доменных имён. Интернет стал очень популярным средством для обмена информацией. В настоящее время подключиться к Интернету можно через спутники связи, радио-каналы, кабельное телевидение, телефон, сотовую связь, специальные оптико-волоконные линии или электропровода. Всемирная сеть стала неотъемлемой частью жизни в развитых и развивающихся странах. В течение пяти лет Интернет достиг аудитории свыше 50 миллионов пользователей. Другим средствам коммуникации требовалось гораздо больше времени для достижения такой популярности:
Информационная среда Время, лет
Радио 38
Телевидение 13
Кабельное телевидение 10
Интернет 5

Интернет. Основные сервисы

 

Рассмотрим основные ресурсы (службы) Интернета. К основным сервисам Интернета на сегодняшний день можно отнести следующие сервисы:

 

· всемирная паутина (World Wide Web, WWW);

 

· электронная почта (e-mail);

 

· файловые архивы FTP;

 

· общение в Интернете.

 

Самым популярным ресурсом Интернета является всемирная паутина или WWW, которая представляет собой огромное количество (свыше миллиарда) мультимедийных документов, отличительной особенностью которых является возможность ссылаться друг на друга. Это означает присутствие в текущем документе ссылки, реализующей переход на любой документ WWW, который физически может быть размещен на другом компьютере сети Интернет. Информация в WWW представляется в виде документов, каждый из которых может содержать как внутренние перекрестные ссылки, так и ссылки на другие документы, хранящиеся на том же самом или на любом другом сервере.

Гипертекст - множество отдельных документов (страниц), которые имеют ссылки друг на друга. В Интернете существует несколько способов передачи данных (протоколов). Самым популярным в сети является протокол передачи гипертекста – http (Hyper Text Transfer Protocol)

 

Гипертекстовая ссылка - выделенная часть документа, реализующая переход к другому документу. Реализуется в виде подчеркнутого текста, кнопки или картинки.

 

E-mail (электронная почта). Старейшим ресурсом Интернета является E-mail (электронная почта) - система пересылки электронных писем. E-mail – это средство обмена информацией, подготовленной в электронном виде, между людьми, имеющими доступ к компьютерной сети. Основными областями применения электронной почты являются ведение личной переписки и работа с некоторыми информационными ресурсами Интернета, такими как списки рассылки, off-line группы новостей и системы пересылки файлов по электронной почте. Электронная почта (e-mail) широко используется в библиотечном процессе. Это и просто деловая переписка, и технологическая основа служб - ЭДД, «Запрос-ответ».

 

FTP (File Transfer Protocol, протокол передачи файлов) - хранилище и система пересылки всевозможных файлов. FTP позволяет подключаться к серверам FTP, просматривать содержимое каталогов и загружать файлы с сервера или на сервер; кроме того, возможен режим передачи файлов между серверами хранилищ и система пересылки всевозможных файлов.

ICQ - система, реализующая связь, подобную пейджинговой, через Интернет. Позволяет получить уникальный номер, называемый UIN (Universal Internet Number, универсальный номер Интернета), используемый для вызова и прямого общения. Замечательной возможностью системы является поиск абонента сети ICQ по косвенным данным, например, по адресу электронной почты. После установления связи с абонентом можно побеседовать с ним, отправляя текстовые сообщения.

 

Информационно-поисковые системы Интернета

 

Все поисковые системы объединяет то, что они расположены на специально-выделенных мощных серверах и привязаны к эффективным каналам связи. Поисковые системы называют еще информационно-поисковыми системами (ИПС). Количество одновременно обслуживаемых посетителей наиболее популярных систем достигает многих тысяч. Самые известные обслуживают в сутки миллионы клиентов. В случаях, когда поисковая система имеет в своей основе каталог, она называется каталогом. В ее основе лежит работа модераторов. В основе же ИПС с полнотекстовым поиском лежит автоматический сбор информации. Он осуществляется специальными программами. Эти программы периодически исследуют содержимое всех ресурсов Интернета. Для этого они перемещаются, или как говорят, ползают, по разным ресурсам. Соответственно такие программы называются роботы. Есть и другие названия: поскольку WWW – это аббревиатура выражения Всемирная паутина, то такую программу естественно назвать спайдером по англ. – паук. В последнее время используются другие названия: автоматические индексы или директории. Все эти программы исследуют и «скачивают» информацию с разных URL-адресов. Программы указанного типа посещают каждый ресурс через определенное время. Ни одна поисковая система не в состоянии проиндексировать весь Интернет. Поэтому БД, в которых собраны адреса проиндексированных ресурсов, у разных поисковых систем разные. Тем не менее, многие из них стремятся, по возможности, охватывать в своей работе все пространство мировой Сети. Это универсальные системы.

 

Итак, работа поисковой системы обеспечивается тремя составляющими:

 

· Программа «робот» (спайдер). Она анализирует ресурсы и производит их индексацию.

 

· Индексы поисковой системы. Они формируют создаваемые поисковой системой собственные БД.

 

· Программа, которая в соответствии с запросом пользователя готовит ему ответ на основе анализа индексов, то есть собственных БД.

 

Пользователь реально имеет дело только с последней из этих трех составляющих.

 

Мощные поисковые системы универсального типа созданы для работы на всех основных языках мира. Каждая страна старается создать хотя бы одну собственную поисковую систему. Познакомимся с основными отечественными и зарубежными поисковыми системами.

 

Яndex (http://www.yandex.ru) – самая популярная в настоящее время отечественная поисковая система. Начала работу в 1997 г. Она содержит более 33 миллионов документов, поддерживает собственный каталог Интернет-ресурсов. Также является лучшей поисковой системой для выявления иллюстраций. Англоязычный вариант снабжен справочником ресурсов Интернет. Обладает развернутой системой формирования запроса. В частности, допускается ввод поискового предписания на естественном языке - в этом случае все необходимые расширения производятся автоматически. Более детальный запрос может быть составлен с помощью режима «Расширенный поиск» (знак +), в котором применяется система многоступенчатых меню.

 

Яндекс - единственная российская поисковая система, индексирующая документы в форматах PDF, DOC, RTF, SWF, PPT и XLS. Актуализация базы осуществляется еженедельно.

 

Rambler (http://www.rambler.ru) – одна из первых российских ИПС, открыта в 1996 году. В конце 2002 года была произведена коренная модернизация, после которой Rambler вновь вошел в группу лидеров сетевого поиска. В настоящее время объем индекса составляет порядка 150 миллионов документов. Для составления сложных запросов рекомендуется использовать режим «Детальный запрос», который предоставляет широкие возможности для составления поискового предписания с помощью пунктов меню.

 

АПОРТ (http://www.aport.ru). На сегодняшний день объем ее базы составляет более 20 миллионов документов. Система обладает широким спектром поисковых возможностей. АПОРТ обладает функцией встроенного переводчика, это дает пользователю возможность формулировать запросы, как на русском, так и на английском языках. Кроме того, АПОРТ имеет специальные режимы для поиска иллюстраций и аудио файлов.

 

Поисковая система компании Mail.ru начала работать в 2007 году. Объем индексного файла весной 2009 г. составлял более 1.5 миллиарда страниц, расположенных на русскоязычных серверах. Помимо разыскания текстов, системой осуществляется поиск иллюстраций и видеофрагментов, размещенных на специализированных "самонаполняемых" российских серверах: Фото@Mail.Ru, Flamber.Ru, 35Photo.ru, PhotoForum.ru, Видео@Mail.Ru, RuTube, Loadup, Rambler Vision и им подобных. Gogo.ru позволяет ограничивать область поиска сайтами коммерческой направленности, информационными сайтами, а также форумами и блогами. Форма "Расширенного поиска" также дает возможность ограничить разыскания определенными типами файлов (PDF, DOC, XLS, PPT), местом положения искомых слов в документе или

 

 определенным доменом.

 

Наиболее популярными зарубежными поисковыми системами являются Google, Alta Vista, Scirus.

 

Google (http://www.google.com) — одна из самых полных зарубежных ИПС. Объем ее базы составляет более 560 миллионов документов. Отличительной особенностью ИПС Google является технология определения степени релевантности документа путем анализа ссылок других источников на данный ресурс. Чем больше ссылок на какую-либо страницу имеется на других страницах, тем выше ее рейтинг в ИПС Google.

 

AltaVista (http://www.altavista.com) – одна из старейших поисковых систем занимает одно из первых мест по объему документов – более 350 миллионов. AltaVista позволяет осуществлять простой и расширенный поиск. «Help» позволяет даже неподготовленным пользователям правильно составлять простые и сложные запросы.

Основные виды поиска

Поиск информации является одной из составляющих человеческой деятельности. В Интернете ежедневно появляется и исчезает огромное количество ресурсов. Необходимо уметь в них ориентироваться. Чтобы эффективно выполнить поиск, нужно умело составить запрос к поисковой системе. Если ответ ищется в каталоге, то особых сложностей при работе здесь нет. Создатели каталога и модераторы озаботились созданием разделов каталога. Пользователь должен только четко определиться с предметом поиска и затем воспользоваться структурой, которая ему предложена.

 

В основе полнотекстового поиска лежит умение удачно составить поисковый запрос. При прочих равных условиях следует выбирать для поиска наиболее суженное, мало распространенное слово. В то же время может случиться и так, что поиск по слишком узкому термину не дает результатов. Тогда надо переходить к более широким терминам.

 

Если поиск по узкому термину не дает результатов, то следует постепенно расширять поисковое понятие или же переходить к смежным терминам.

 

Поиск по возможности лучше вести по нескольким словам, их сочетаниям, а иногда и по конкретным фразам.

 

При проведении поиска и оценке его результатов необходимо помнить:

 

· Слепое доверие к результатам, размещенным в Сети, чревато ошибками.

 

· Остерегайтесь анонимных сведений, т. к. их источник установить очень трудно.

 

· В сомнительных случаях не ленитесь проверить найденные сведения запросом в Сети отзывов и мнений по поводу найденных сведений.

 

· Неожиданно появляющиеся и затем быстро исчезающие ресурсы не надежны.

 

· В сомнительных случаях необходимо обращаться к таким проверенным источникам, как сетевые энциклопедии, справочники и специальные учебные сайты.

 

Избегайте «сенсационных» данных, результатов с чрезмерно большой точностью, чисто полемических, рекламных и необъективных материалов.

 

Приступая к поиску, вы вводите одно или несколько ключевых слов, выбираете вид поиска и нажимаете на клавишу Enter. В ответ выдается список адресов (URL) – список всех индексированных страниц, содержащих любые ключевые слова. Нередко число совпадений при таком поиске огромно. Однако если поисковая система хорошо сортирует результаты по тематике, то нужную страницу можно найти в верхней части списка. Поиск по любому слову может быть удобен в случаях, когда пользователь не уверен в ключевых словах.

 

Следует иметь в виду, что поисковые машины относятся к словам по-разному. Такие ИПС как «Яндекс» понимают слово во всех его грамматических формах и с учетом этого будут его искать. Им известна морфология русского языка, т. е. если в запросе написать и «человек» и «люди», то ответ будет одним и тем же.

 

При поиске в Интернете используются следующие логические операторы:

 

- AND – и (и то и то – два термина вместе);

 

- OR – или (или тот термин или тот);

 

- NOT – не (не нужен такой-то термин).

 

Используя значок *, можно расширить запрос до всех слов, содержащих введенную часть. Например, если ввести электротехни* то в результатах поиска окажутся страницы, содержащие электротехника, электротехнический и т. п. Знак усечения * может быть подставлен в ключ справа, слева и внутри. В Yandex можно запрашивать конкретную форму слова при поиске (исключив другие словоформы), поставив перед ним знак «!».


Дата добавления: 2020-11-27; просмотров: 75; Мы поможем в написании вашей работы!

Поделиться с друзьями:




Мы поможем в написании ваших работ!