Понятия о базах данных. Графическая и атрибутивная базы данных



Основным ядром каждой информационной системы (и ГИС в том числе), является база данных (БД). Под базой данных понимается поименованная совокупность данных, отображающая состояние объекта, его свойства и взаимоотношения с другими объектами, а также комплекс технических и программных средств для ведения этих баз данных.

В самом общем смысле база данных (БД) - это набор записей и файлов, организованных специальным образом. В базе данных любой ГИС можно хранить, например, фамилии и адреса друзей или клиентов (текстовая информация) и карту города с нанесенными домами (графическая информация), координаты, значения площадей, другие количественные характеристики (метрическая информация).

Базы данных делятся на иерархические, сетевые и реляционные.

1) Иерархические базы данных устанавливают строгую подчиненность между записями.

Для хранения данных, имеющих такую структуру, была разработана иерархическая модель данных, которую иллюстрирует рис. Входящие в состав такой модели записи об­разуют древовидную структуру - каждая из них связана с одной записью, находящейся на более высоком уровне иерархии. Доступ к любой из записей осуществляется путем прохода по строго определенной цепочке узлов дерева с последующим просмотром соответствующих этим узлам записей. Для достаточно простых задач иерархическая система эф­фективна, но она практически непригодна для использования в сложных системах с оперативной обработкой запросов и распре­деленной архитектурой. Иерархическая организация трудно мо­дифицируема и поэтому не может обеспечить быстродействие, необходимое для работы в условиях одновременного модифици­рования файлов несколькими прикладными системами.

Рисунок -  Иерархическая база данных

2) Сетевые базы данных это база данных, в которой одна за­пись может участвовать в нескольких отношениях предок-потомок. Фактически база данных представляет собой не дерево, а произвольный граф. Все данные считаются потенциально взаимосвязанными (рис).

Использовались в том случае, если структура данных оказывалась сложнее, чем обычная иерархия, т.е. простота структуры иерархической базы данных становилась её недостатком. Как сетевые, так и иерархические базы данных были очень жесткими. Наборы отношений и структуру записей приходилось задавать заранее.

Землепользование

Изменение структуры базы данных обычно означало перестройку всей базы данных, а для получения ответа на запрос приходилось писать специальную программу поиска данных. Реализация пользовательских запросов часто затягивалась на недели и месяцы, к моменту появления программы информация, которую она предоставляла, часто оказывалась бесполезной.

3)Реляционная модель была попыткой упростить структуру БД. Реляционной считается такая база данных, в которой все данные представлены в виде простых таблиц, разбитых на стро­ки и столбцы, и все операции над базой данных сводятся к ма­нипуляциям с таблицами.

Особенности реляционной базы данных можно сформулировать следующим образом:

1) Данные хранятся в таблицах, состоящих из столбцов ("атрибутов") и строк ("записей", "кортежей").

2) На пересече­нии каждого столбца и строчки стоит в точности одно значение.

3) У каждого столбца есть своё имя, которое служит его назва­нием, и все значения в одном столбце имеют один тип.

4) Запросы к базе данных возвращают результат в виде таблиц, которые тоже могут выступать как объект запросов.

5) Строки в реляци­онной базе данных неупорядочены - упорядочивание произво­дится в момент формирования ответа на запрос.

Более наглядно структуру таблицы иллюстрирует рис.5.5.2 , на котором изображена таблица РАЙОНЫ.

Каждая горизонтальная строка этой таблицы представляет отдельную физическую сущность – один административный район. Она же представлена на карте отдельным графическим объектом.

Все N строк таблицы вместе представляют все N районов одной области. Все данные, содержащиеся в конкретной строке таблицы, относятся к району, который описывается этой строкой.

Все значения, содержащиеся в одном и том же столбце, являются данными одного типа. Например, в столбце Районный центр содержатся только слова, в столбце Площадь содержатся десятичные числа, а в столбце ID содержатся целые числа, представляющие коды объектов, установленные пользователем. Связь между таблицами осуществляется по полям.

Каждая таблица имеет собственный, заранее определенный набор поименованных столбцов (полей). Поля таблицы обычно соответствуют атрибутам объектов, которые необходимо хранить в базе. Количество строк (записей) в таблице не ограничено и каждая запись несет информацию о каком-либо объекте.

На сегодняшний день реляционные базы данных являются наиболее популярной структурой для хранения данных, поскольку сочетают в себе наглядность представления данных с относительной простотой манипулирования ими.

Общепринятым стандартом языка работы с реляционными базами данных является язык SQL. К числу наиболее известных СУБД реляционного типа от­носятся dBase, Clipper, FoxBASE, Paradox, ORACLE, Microsoft Access.

 

В реляционных БД содержатся два типа данных:графические и атрибутивные (или семантические).

В графической базе данных хранится так называемая графическая или метрическая основа карты в цифровом виде. Кроме метрической информации объекты должны обладать временной и описательной информацией.

Атрибутивная база данных содержит в себе определенную смысловую нагрузку карты и дополнительные сведения, которые относятся к пространственным данным, но не могут быть прямо нанесены на карту- это описание территории или информация, описывающая качественные характеристики объектов (атрибуты). Таблица, содержащая атрибуты объектов, называется таблицей атрибутов, например при сборе характеристик по городу можно указать численность жителей, число театров и концертных залов, протяженность автодорог и линий связи; по району - его общая площадь и число землепользователей; по сотруднику предприятия - имя, фамилия, отчество, пол, возраст, стаж работы, размер заработной платы и т. д. И для хранения всей этой информации применяют атрибутные таблицы.

Каждая строка таблицы соответствует одному объекту; каждый столбец – тематическому признаку; ячейка, находящаяся на пересечении строки и столбца, отражает значение определенного признака выбранного объекта. Важным атрибутом являются временные характеристики.

В ГИС обычно встроены не только средства отображения базы данных, но и специальные программы- так называемые системы управления базами данных (СУБД).

С использованием СУБД осуществляется поиск, сортировка, добавление и исправление информации в базах данных. Этот модуль позволяет создать новую атрибутивную таблицу, заполнить ее и привязать к карте.

Не следует понимать, что графические объекты живут сами по себе, а атрибутика - сама по себе. Напротив, интеграция достигает порой той степени, когда графический объект физически хранится как одно из полей атрибутивной таблицы, несколько же других полей реально в таблице базы данных не существуют, а отображают автоматически отслеживаемые географические параметры объекта (длину, периметр, площадь.)

Атрибутивные базы данных не только помогают по-разному отобразить объекты с различными свойствами. При выполнении пространственных запросов атрибутика помогает более точно идентифицировать объект - в самом простом случае мы можем указать объект на карте и получить о нем подробную информацию (номер, имя, размер и т.д.) Можно, разумеется, организовывать выбор объектов на карте посредством запросов к атрибутивной таблице, так как мы знаем, что выделение объектов связано с выделением их атрибутивных записей.

Все объекты и примитивы должны иметь свой номер или идентификатор, при помощи которого можно поставить в соответствие к графической информации атрибутивную (рис.5.5.3).

Использование идентификаторов открывает широкие возможности для просмотра и анализа картографического изображения. Пользователь может указать на объект, например курсором, и система определит его идентификатор, по которому найдет относящиеся к объекту одну или несколько баз данных и, наоборот, по информации в базе определит графический объект.

Однако набор записей (иногда несколько сот тысяч), содержащий графическую (метрическую) и атрибутивную информацию о каком-либо объекте хоть и очень похож, однако еще очень далек от того образа реального мира, который мы называем картой. Пока можно говорить только о том, что множество цифровых данных о пространственных объектах образует цифровую модель объекта местности, содержащую сведения о его местоположении (координаты) и набор свойств и характеристик (атрибутов).

Рассматривая вопрос о цифровых моделях, нельзя не отметить, что в реальных ГИС мы имеем дело не с абстрактными линиями и точками, а с объектами, занимающими пространственное положение и имеющими сложные взаимосвязи между собой. Поэтому полная цифровая модель объекта в цифровой карте в обязательном порядке включает в себя:

· геометрическую (метрическую) информацию;

· атрибуты-признаки, связанные с объектом и его характеризующие;

· неметрические (топологические) характеристики, которые объясняют связи между объектами.

К топологическим характеристикам можно отнести: ориентацию (по отношению одного объекта к другому); примыкание (наличие общей границы и точек); включение (вложенность контуров), совпадение (наложение одного объекта на другой) и т.п.

Топологические характеристики заносятся при кодировании данных в виде дополнительных атрибутов. Этот процесс во многих ГИС осуществляется автоматически при дигитализации данных. 

 

Форматы графических файлов.

Файлы, в которых много однородных заливок (логотипы, надписи, схемы). Метод сжатия LZW (Lempel-Ziv-Welch) действует гораздо лучше, чем RLE при сжатии произвольных графических данных, но процесс кодирования и распаковки происходит медленнее.

GIF позволяет записывать изображение «через строчку» (Interlaced), благодаря чему, например, при отображении файла в Интернет можно увидеть изображение целиком, но с меньшим разрешением, задолго до окончания полной загрузки файла. В 1989 г. формат был модифицирован (GIF89a) за счёт добавления поддержки прозрачности и анимации. В результате в GIF можно установить один или более цветов прозрачными, эти цвета станут невидимыми в программах просмотра Интернет и некоторых других. Кроме того, файл GIF может содержать не одну, а несколько растровых картинок, которые программа может подгружать одну за другой с указанной в файле частотой. Так достигается иллюзия движения (GIF-анимация). Основное ограничение формата GIF состоит в том, что цветное изображение может быть записано только в режиме 256 цветов. Это ограничение обусловливает применение данного формата в основном при создании электронных публикаций для сети Интернет.

Формат JPEG (Joint Photographic Experts Group) был разработан группой экспертов в области фотографии в рамках ISO (Международной организации по стандартизации) специально для сжатия 24-битных изображений. Данный формат представляет эффективный метод хранения изображений с большой глубиной цвета. Главное отличие формата JPEG от других состоит в том, что в JPEG используется алгоритм сжатия с потерями, который необратимо искажает изображение. Это не сильно заметно при его простом просмотре, но становится явным при детальной работе с изображением. Как правило, при сохранении графического изображения в формате JPEG в специальном диалоговом окне можно задать степень сжатия. При этом, чем выше уровень сжатия, тем ниже качество. Но зато, используя JPEG, можно получить файлы иногда в несколько сотен раз меньше по объему, чем в формате BMP. Формат JPEG аппаратно независим, поддерживается на IBM PC и Apple Macintosh. Существуют также различные версии JPEG: Baseline Optimized, Progressive. Особенностью JPEG Progressive является поддержка чересстрочного вывода. Формат JPEG идеально подходит для обычного пользователя, т.к. в данном формате можно хранить полноцветные24-битовые изображения при малом объеме без больших потерь качества. Однако, стоит заметить, что JPEG не подходит для хранения «контурных» рисунков (карт), т.к. из-за особенностей алгоритма сжатия контуры и текст становятся размытыми, т.к. из-за особенностей алгоритма сжатия контуры и текст становятся размытыми. Поскольку в «PEG отсутствует истинная информация о цвете, он практически не пригоден для работы с ДДЗЗ (цветокоррекция и т.п.).

также включать информацию о номере версии формата или сведения об авторских правах. Наиболее распространены такие растровые форматы, как BMP, TIFF, PCX, GIF, JPEG.

Формат BMP (Windows Bitmap) используется ОС Windows (Microsoft Corp.) для внутреннего хранения растровых изображений. Он является форматом, который по умолчанию используется Windows-приложениями, создающими растровые рисунки. К плюсам данного формата можно отнести поддержку любыми Windows-совместимыми программами. В качестве недостатка формата BMP можно указать слабые возможности сжатия. В данном формате используется метод сжатия RLE, который применим только к 4- и 8-битным изображениям. В общем, файлы BMP, как правило, занимают больше места на диске, чем файлы других форматов. К тому же применение файлов BMP ограничено платформами Windows и OS/2 и невозможно на других (например, Macintosh).

Формат TIFF (Tagged Image File Format) является одним из самых распространённых и надёжных и используется для хранения растровых изображений высокого качества. Формат TIFF - аппаратно независимый, т.е. его поддерживают практически все графические программы на IBM PC и Apple Macintosh. Ему доступен весь диапазон цветового охвата от черно- ; белого до моделей RGB и CMYK. Кроме того, данный формат может сохранять разнообразные дополнительные сведения о растре, включая: кривую коррекции для изображения с оттеками серого; поля детальной информации об изображении (название программы, автора, дату создания и комментарии); размер изображения и разрешающую способность; детальную информацию о цвете оригинала (Основы..., 1998). Для формата TIFF доступны разнообразные схемы сжатия (например, встроенный алгоритм LZW). Благодаря хорошей цветопередаче и наличию эффективного механизма сжатия, формат TIFF идеально подходит для хранения сканированных аэрофото- и космических снимков (с глубиной цвета до 48 бит), а также топокарт (с индексированными цветами 4 или 8 бит на пиксел) [16].

Формат PCX (PC PaintBrush File Format) является одним из наиболее распространённых и был разработан фирмой Z-Soft для программы PC PaintBrush. Открывать или импортировать файлы PCX могут почти все графические приложения для персональных компьютеров. Применяется сжатие RLE. Однако PCX не поддерживает модель CMYK или другие модели, отличные от RGB. Неудобная схема сжатия может даже увеличивать размеры некоторых файлов. В настоящее время данный формат считается устаревшим.

Независящий от аппаратного обеспечения формат GIF (Graphics Interchange Format) был разработан в 1987 г. фирмой CompuServe специально для передачи растровых изображений по сетям (GIF 87а). Поэтому этот формат отличается очень эффективным механизмом сжатия и некоторыми функциями, ускоряющими загрузку изображения с Web- страниц. GIF использует LZW-компрессию, что позволяет неплохо сжимать наоборот. AI несколько уступает CDR по иллюстративным возможностям: в одном файле может содержаться только одна страница, маленькое рабочее поле— всего 3x3 м. Тем не менее, он отличается наибольшей стабильностью и совместимостью с языком PostScript фирмы Adobe, на который ориентируются практически все издательско-полиграфические приложения.

EPS (Encapsulated PostScript) - формат описания как векторных, так и растровых изображений на языке PostScript. Главным достоинством этого формата является его универсальность. Едва ли не все программы, работающие с графикой, могут писать и читать файлы в этом формате. В файле EPS могут одновременно храниться векторная и растровая графика, шрифты, параметры калибровки оборудования, цветовые профили. Кроме этого, формат EPS позволяет записать векторный контур, ограничивающий растровое изображение. Так, например, можно получить не прямоугольную фотографию, а круглую, овальную или любой другой формы. Для отображения на экране векторного содержимого файла EPS используется формат WMF, а растрового - TIFF. Но экранная копия лишь в общих чертах отображает реальное изображение, что является существенным недостатком EPS. Действительное изображение можно увидеть лишь на выходе выводного устройства с помощью специальных программ просмотра или после преобразования файла в формат PDF в приложениях Adobe Acrobat Reader и Acrobat Exchange. Одним из недостатков формата EPS также является то, что EPS-файлы, созданные различными программами, открываются по-разному, а порой и вовсе не открываются. Это происходит в основном из-за наличия нескольких версий языка PostScript.

Формат PDF (Portable Document Format) предложен фирмой Adobe как независимый от платформы формат, в котором могут быть сохранены и графические изображения (векторные и растровые), и текст с множеством шрифтов и гипертекстовых ссылок. Так как шрифты содержатся непосредственно в документе PDF, то документ всегда будет выглядеть так, как задумал его автор, на любом компьютере, независимо от используемого на нём программного обеспечения. Данный формат отличается очень компактным хранением информации. Для достижения минимального размера файла при высоком качестве иллюстраций в PDF используется мощный алгоритм сжатия, причём каждый вид объектов в документе сжимается по наиболее выгодному для него алгоритму (например, растровые изображения записываются в формате JPEG). Просматривать документы в формате PDF и распечатывать их на принтере можно с помощью бесплатной программы Adobe Acrobat leader. Однако эта программа не даёт возможности создавать или изменять PDF-файлы. Многие графические пакеты (Adobe PageMaker, CorelDRAW, FreeHand) имеют функции экспорта документов в PDF. Исходя из практического отсутствия программного обеспечения для редактирования PDF-файлов, обычно в этом формате хранят документы, предназначенные только для чтения, но не для редактирования.

 

2.3.2 Векторные форматы

 

В отличие от растровых форматов, в сфере векторной графики практически отсутствуют стандартные форматы, которые могли бы использоваться различными программами и на разных платформах. Почти все векторные графические программы имеют свои собственные форматы, что связано, скорее всего, со спецификой алгоритмов формирования векторного изображения. Файлы векторных форматов содержат описания изображения в виде набора команд для построения графических примитивов, а такте некоторую дополнительную информацию. Различные векторные форматы отличается набором команд и способом их кодирования. Но так как в векторной графике иногда существует необходимость переноса файлов между различными приложениями, то своего рода стандартом стали файловые форматы WMF, CDR, AI. Также получили популярность некоторые универсальные форматы, поддерживающие как векторные, так и растровые изображения: EPS, PDF


Дата добавления: 2018-02-28; просмотров: 349; ЗАКАЗАТЬ РАБОТУ