Внутримашинная организация экономической информации

Файловая организация данных, ее недостатки

Предшественниками систем баз данных являются файловые системы — наборы программ, выполняющие для пользователей некоторые операции, например, ввод данных, их обработку и формирование некоторых отчетов.

Файловым системам присущи следующие ограничения:

· разделение и изоляция данных, содержащихся в отдельных файлах;

· дублирование данных в файлах;

· зависимость структуры программ от данных;

· несовместимость форматов файлов;

· слабая адаптация приложения к изменению требований (фиксированные запросы);

· быстрое увеличение объема приложения.

Названные ограничения файловых систем являются следствиями двух факторов: определение данных содержится внутри приложений, а не хранятся отдельно и независимо от них; помимо приложений не предусмотрено никаких других инструментов доступа к данным и их обработки.

Понятие базы данных. Преимущества базы данных

База данных — совместно используемый набор структурированных, логически связанных данных, предназначенных для удовлетворения информационных потребностей пользователей организации.

База данных — это единое, интегрированное, большое хранилище данных, используемое одновременно многими пользователями.

Система баз данных включает сами по себе данные, сохраняемые в базе данных, аппаратное обеспечение, программное обеспечение, пользователей различных категорий (прикладные программисты, конечные пользователи, администратор базы данных).

К преимуществам систем баз данных относятся:

· физическая независимость данных от пользовательских приложений;

· возможность совместного доступа к данным нескольких существующих приложений базы данных;

· сокращение избыточности данных;

· устранение противоречивости данных;

· обеспечение целостности (корректности) данных в базе;

· организация защиты данных;

· возможность введения стандартизации данных.

База данных, как правило, состоит из четырех основных компонент: данных пользователя, метаданных, индексов и метаданных приложений.

Данные пользователя представляются в виде группы таблиц, состоящих из строк (записей) и столбцов (полей).

Метаданные представляют собой описание структуры базы данных с помощью так называемых системных таблиц.

Индексыявляются средством ускорения операций поиска, извлечения, модификации и сортировки данных.

Метаданные приложенийописывают структуру и формат форм, отчетов и других компонентов приложений базы данных.

Вопросы для самопроверки

1. Какие существуют признаки классификации экономической информации?

2. Назовите структурные единицы экономической информации?

3. Как классифицируются экономические информационные системы?

4. Из каких элементов состоит автоматизированная информационная система?

5. Назовите формы представления внемашинной организации экономической информации?

6. Какова структура документа?

7. Каковы различия иерархической и фасетной систем классификации объектов?

8. Что подразумевают под системой кодирования информации?

9. Какие ограничения присущи файловым системам организации данных?

10. Из каких компонентов состоит база данных?

Тема 2. МОДЕЛИ ДАННЫХ

Трехуровневая модель организации баз данных

Концепции многоуровневой архитектуры СУБД служат основой современной технологии БД. Эти идеи впервые были сформулированы в отчете рабочей группы по базам данных Комитета по планированию стандартов Американского национального института стандартов (ANSI/X3/SPARC), опубликованному в 1975 г. В нем была предложена обобщенная трехуровневая модель архитектуры СУБД, включающая внешний, концептуальный и внутренний уровни (рис. 2.1).

Рис. 2.1. Трехуровневая модель архитектуры СУБД

· Внешний уровень архитектуры БД предназначен для различных групп пользователей. Этот уровень определяет точку зрения на БД отдельных приложений. Каждое приложение видит и обрабатывает только те данные, которые необходимы именно этому приложению. Например, система распределения работ использует сведения о квалификации сотрудника, но ее не интересуют сведения об окладе, домашнем адресе и телефоне сотрудника, и наоборот, именно эти сведения используются в подсистеме отдела кадров.

· Концептуальный уровень — центральное управляющее звено, здесь база данных представлена в наиболее общем виде, который объединяет данные, используемые всеми приложениями, работающими с данной базой данных. Фактически концептуальный уровень отражает обобщенную модель предметной области (объектов реального мира), для которой создавалась база данных. Как любая модель, концептуальная модель отражает только существенные, с точки зрения обработки, особенности объектов реального мира. Концептуальный уровень — это попытка представить требования к базе со стороны организации. И этот уровень не должен содержать никаких сведений о методах хранения данных. Здесь должны быть отражены: все сущности, включаемые в базу, их атрибуты и связи; накладываемые на данные ограничения; семантическая информация о данных; информация о мерах обеспечения безопасности и поддержки целостности данных.

· Внутренний уровень служит для адаптации концептуальной модели к конкретной СУБД. На этом архитектурном уровне БД представлена в полностью “материализованном” виде, тогда как на других уровнях идет работа на уровне отдельных экземпляров или множества экземпляров записей. Внутренний уровень предназначен для достижения оптимальной производительности и обеспечения оптимального использования дискового пространства. На этом уровне осуществляется взаимодействие СУБД с методами доступа операционной системы. Описание БД на внутреннем уровне называется внутренней схемой или схемой хранения. Здесь хранится информация: о распределение дискового пространства для хранения данных и индексов; описание подробностей хранения данных; сведения о размещении записей; сведения о сжатии данных и методах их шифрования.

Эта архитектура позволяет обеспечить логическую (между уровнями 1 и 2) и физическую (между уровнями 2 и 3) независимость при работе с данными. Логическая независимость предполагает возможность изменения одного приложения без корректировки других приложений, работающих с этой же базой данных. Физическая независимость предполагает возможность переноса хранимой информации с одних носителей на другие при сохранении работоспособности всех приложений, работающих с данной базой данных. Это именно то, чего не хватало при использовании файловых систем. Выделение концептуального уровня позволило разработать аппарат централизованного управления базой данных.

Модели представления данных

Модель представления данных, или модель данных, — множество допустимых типов данных и отношений между ними, ограничений и действий над этими типами данных и отношений. Множество допустимых типов данных и отношений называют структурой данных. Модель данных является ядром базы данных.

Наиболее широко распространенными являются три модели данных: иерархическая, сетевая и реляционная.

Иерархическая модель данных

Иерархическая модель позволяет строить БД с иерархической древовидной структурой.

Дерево — это связный неориентированный граф, который не содержит циклов. Обычно при работе с деревом выделяют какую-то конкретную вершину, определяют ее как корень дерева и рассматривают особо — в эту вершину не заходит ни одно ребро. В этом случае дерево становится ориентированным. Ориентация определяется от корня. Конечные вершины, то есть вершины, из которых не выходит ни одной дуги, называются листьями дерева.

В иерархических моделях данных используется ориентация древовидной структуры от корня к листьям. Графическая диаграмма схемы базы данных называется деревом определения. Пример иерархической модели данных приведен на рис. 2.2.

Иерархическая модель является наиболее простой, поэтому исторически она появилась первой. К достоинствам иерархической модели можно отнести достаточно эффективное использование памяти и неплохие временные показатели выполнения операций над данными. Недостатками же являются достаточно сложные логические связи, определенная трудность в обработке данных и сложность включения новых объектов в заданное структурное «дерево».

Рис. 2.2. Иерархическая модель структуры предприятия

Сетевая модель данных

На разработку этого стандарта большое влияние оказал американский ученый Ч. Бахман. Основные принципы сетевой модели данных были разработаны в середине 60-х гг., эталонный вариант сетевой модели данных описан в отчетах рабочей группы по языкам баз данных (COnference on DAta SYstem Languages) CODASYL (1971 г.). Сетевая модель представляет собой структуру, у которой любой элемент может быть связан с любым другим элементом.(рис. 2.3). Организация данных в сетевой модели соответствует структуризации данных по версии CODASYL. В соответствии с ней описание схемы БД осуществляется на языке COBOL, а манипулирование данными — с помощью включающего языка программирования высокого уровня.

Рис. 2.3. Сетевая модель структуры банка

Каждая вершина графа хранит экземпляры сущностей (записи) и сведения о групповых отношениях с сущностями других типов. Каждая запись может хранить произвольное количество значений атрибутов (элементов данных и агрегатов), соответствующих экземпляру сущности.

Основным достоинством сетевой модели данных является высокая эффективность затрат памяти и оперативность. К недостаткам следует отнести трудность восприятия схемы базы, а также сложность ее понимания, программирования и контроля целостности вследствие допустимости установления произвольных связей.

Реляционная модель данных

Реляционная модель данных была предложена математиком Э.Ф. Коддом в 1970 г. Она является наиболее широко распространенной моделью данных и единственной из трех основных моделей данных, для которой разработан теоретический базис с использованием теории множеств.

Реляционная модель данных представляет собой комплекс двухмерных взаимосвязанных таблиц (отношений) (рис. 2.4):

Рис. 2.4. Схема данных реляционной модели

Информация об объектах определенного типа хранится в таблице, каждое поле (столбец таблицы) которой содержит значения определенной характеристики объектов, а запись (строка таблицы) представляет собой описание отдельного объекта. Даже когда вы запрашиваете информацию из одной или нескольких таблиц, результат запроса представляется в виде таблицы.

При построении реляционных моделей применима строгая математическая теория отношений. В этом случае термину таблицасопоставляетсятермин отношение.

Отношение представляет собой двумерную таблицу, содержащую некоторые данные.

Столбецсодержит элементы данных — атрибуты. Столбцы таблицы со значениями соответствующих атрибутов именуются доменами,а строки со значениями разных атрибутов (А) — кортежами(K).В результате отношение (R)состоит из нескольких кортежей:

R = {Ki}, i= 1, …, n,

где Ki = {A1i, A2i,…,Ami} — кортеж; i — номер кортежа; n — число кортежей; m — число доменов.

Именованное множество пар «имя атрибута — имя домена» называется схемой отношения. Мощность этого множества — называют степенью или «арностью» отношения. Набор именованных схем отношений представляет собой схему базы данных.

Атрибут, значение которого однозначно идентифицирует кортежи, называется ключевым (или просто ключом). В нашем случае ключом является атрибут «Табельный номер», поскольку его значение уникально для каждого работника предприятия. Если ключ состоит из нескольких атрибутов, он называется составным. Ключей может быть несколько; основной ключ — первичный, его значения не могут обновляться.

Кроме первичного ключа в таблице могут быть вторичные ключи, называемые еще внешними ключами, или индексами.

Индекс — это поле или совокупность полей, чьи значения имеются в нескольких таблицах и которое является первичным ключом в одной из них. Значения индекса могут повторяться в некоторой таблице. По первичному ключу всегда отыскивается только одна строка, а по вторичному — может отыскиваться группа строк с одинаковыми значениями первичного ключа. Ключи нужны для однозначной идентификации и упорядочения записей таблицы, а индексы для упорядочения и ускорения поиска.

Связь устанавливается посредством связи ключей, содержащих общую информацию для обоих отношений. Связь существует трех основных типов:

один-к-одному (1:1); один-ко-многим (1:М); многие-к-одному (М:1).

· Связь 1:1 означает, что одному значению первичного ключа соответствует одно и только одно значение вторичного ключа (рис. 2.5).

Рис. 2.5. Связь один-к-одному

· Связь 1:М означает, что одному значению первичного ключа может соответствовать несколько значений вторичного ключа (рис. 2.4).

· Связь М:1 означает, что одному значению вторичного ключа может соответствовать несколько значений первичного (рис. 2.4).

Реляционная целостность — это сохранность данных, которая должна соблюдаться при любых модификациях структуры и данных в базе. Целостность данных обеспечивается каскадным обновлением связанных полей и удалением связанных записей.

К достоинствам реляционной модели можно отнести:

· наличие математической теории ее построения;

· простоту и удобство табличного представления данных;

· минимальную избыточность данных при нормализации отношений;

· полноту, равнозначность данных;

· возможность использования всех типов связей между объектами;

· легкость модернизации ( изменение структуры и количества данных ).

Недостатки:

· нормализация отношений приводит к разъединению данных;

· значительные затраты на разработку и реализацию модели;

· недостаточная производительность обработки очень больших объемов данных.

Использование строгой математической теории отношений для построения реляционной модели позволяет применять языки манипулирования данными на основе реляционной алгебры. Существует пять основных операций реляционной алгебры — проекция, селекция, декартово произведение, разность, объединение — и три вспомогательных: соединение, пересечение и деление.

Дата добавления: 2019-02-12; просмотров: 495; Мы поможем в написании вашей работы!

Поделиться с друзьями:

⇐ Предыдущая 1 234 5 6 7 8 9 10 Следующая ⇒

Мы поможем в написании ваших работ!