Текстовые документы и базы данных



Значительная часть пользователей, приобретая компьютер или получая доступ к нему, прежде всего осваивает операции именно с текстовыми файлами. На первом этапе компьютер обычно используют в качестве удобной и «интеллектуальной» пишущей машинки (для подготовки, хранения, модификации и распечатки всевозможных писем, сочинений, рефератов, объявлений, статей и т.п.).

Вряд ли многие задумываются, что уже на этом этапе они пользуются примитивной информационной системой, которая в данном случае состоит из следующих элементов:

·    текстового редактора как инструмента манипулирования текстами;

·    группы текстовых файлов (базы данных) как объекта обработки.

На следующем этапе многим приходит в голову использовать текстовый файл как некую амбарную книгу, куда легко можно заносить разнообразную «списочную» информацию, например, рецепты, телефонные номера своих знакомых, каталоги своей видеотеки, фонотеки, адреса и названия организаций и прочее. Способ представления и размещения информации в таких «амбарных» книгах обычно придумывает сам пользователь. Например, юрист может поместить в текстовый файл карточки своих клиентов с указанием фамилии, имени и отчества, адреса проживания, темы юридической консультации и других данных, например: «Иванов П.И., Тула, ул. Сафонова, д. 12, наследство», «Сидоров П.Т., Москва, ул. Тверская, д.34, кв. 25, автомобильная авария» и т.п.

В чем недостатки такого подхода? Создавая базы данных, мы стремимся обеспечить себе возможность, во-первых, упорядочивать информацию по различным признакам (например, по теме консультации), а во-вторых - быстро извлекать выборки с произвольным сочетанием признаков (например, клиентов, обращавшихся за консультацией по поводу получения наследства). Однако описанная выше организация данных не позволит ни того, ни другого, потому что упорядочить информацию в текстовом файле значительно сложнее, чем даже в картонной коробке. К тому же компьютер не сможет даже выбрать клиентов с одной темой консультации, если в записи про разных клиентов одна и та же тема записана по-разному (например, «наследство», «Наел.» и т.п.).

Чтобы компьютер мог безошибочно искать и систематизировать данные, надо прежде всего выработать и соблюдать при записи данных некоторые правила (соглашения) о способах представления информации. Применительно к вышеописанной информационной системе юриста это означает, что тема консультации должна обозначаться совершенно одинаково во всех случаях записи. Все записи о клиентах должны иметь одинаковую длину (например, по две строки на клиента), положение описания определенных атрибутов данных в каждой записи должно быть одно и то же (например, запись начинается с фамилии, тема юридической консультации записывается с начала второй строки). Такой процесс приспособления форматов и значений данных к возможностям компьютера, т.е. устранение произвола в представлении длины и (или) значений, называется структурированием информации. Другими словами, структурирование - это введение соглашений о способах представления данных. Отсюда следует, что информационная система - это совокупность тем или иным способом структурированных данных (базы данных) и комплекса аппаратно-программных средств для хранения данных и манипулирования ими.

 

Виды моделей данных

Основа информационной системы, объект ее обработки - база данных (БД). База данных - это совокупность сведений о конкретных объектах реального мира в какой-либо предметной области или разделе предметной области. Например, база данных по вузам (высшее образование), база данных по лекарственным препаратам (медицина), база данных по автомобилям (автомагазин), база данных по стройматериалам (склад) и т.п. Синоним термина «база данных» - «банк данных».

Ядром любой базы данных является модель данных, которая представляет собой структуру данных, соглашения о способах их представления и операций манипулирования ими. Иными словами, это формализованное описание объектов предметной области и взаимосвязей между ними.

Различают три основных типа моделей данных: иерархическую, сетевую и реляционную. Иерархическая структура представляет собой совокупность элементов, в которой данные одного уровня подчинены данным другого уровня, а связи между элементами образуют древовидную структуру. В такой структуре исходные элементы порождают другие элементы, причем эти элементы в свою очередь порождают следующие элементы и т.д. Существенно то, что каждый порожденный элемент имеет только одного «родителя». Обратите внимание, что в иерархической структуре порождающим элементом может быть не объект сам по себе, а только конкретный экземпляр объекта. Примером иерархической базы данных может служить генеалогическое древо вашей семьи.

Существуют и более сложные - сетевые структуры, в которых каждый порожденный элемент может иметь более одного порождающего элемента. Сетевая модель данных отличается от иерархической тем, что каждый элемент сетевой структуры данных связан с любым другим элементом. Примером сложной сетевой структуры может служить структура базы данных, содержащая сведения об учащихся, занимающихся в различных кружках. При этом возможны занятия одного и того же ученика в разных кружках, а также посещение несколькими учениками занятий одного кружка. Сетевые и иерархические структуры можно свести к простым двумерным таблицам.

 

Реляционные базы данных

Наиболее удобным и для пользователя, и для компьютера является представление данных в виде двумерной таблицы - большинство современных информационных систем работает именно с такими таблицами. Базы данных, которые состоят из двумерных таблиц, называются реляционными, (по-английски «relation» - отношение). Основная идея реляционного подхода состоит в том, чтобы представить произвольную структуру данных в виде простой двумерной таблицы.

 Реляционная таблица обладает следующими свойствами:

·    каждая строка таблицы — один элемент данных (сведения об одном учащемся);

·    все столбцы в таблице однородные, т.е. все элементы в столбце имеют одинаковый тип и длину (например, в столбце Имя отображаются имена учащихся символьного типа длиной не более 17 символов);

·    каждый столбец имеет уникальное имя (например, в таблице нет двух столбцов Имя);

·    одинаковые строки в таблице не допускаются (запись о каждом учащемся делается только один раз);

·    порядок следования строк и столбцов в таблице может быть произвольным (запись об учащемся в таблицу делается при поступлении в школу, при этом порядок следования столбцов не имеет значения).

 


Дата добавления: 2018-10-26; просмотров: 260; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!