Лекция 3. Интеграция и трансформации данных



В лекции рассматривается платформа SQL Server 2008 для построения систем оперативного и интеллектуального анализа данных. Обсуждаются принципы функционирования средств администрирования и управления, сервисов извлечения, преобразования и загрузки данных

Цель лекции – изучение учащимися инструментальных средств, необходимых для построения хранилищ и витрин данных, подключения к источникам данных и создания запросов служб анализа.

 

Платформа SQL Server 2008 является десятой версией программного продукта Microsoft SQL Server. Первая версия этого продукта появилась в 1987 году. Первая версия продукта, разработанная полностью фирмой Microsoft, появилась од названием SQL Server 6.0. В 1996 году фирма выпустила версию SQL Server 6.5. Существенно модифицированная версия SQL Server 7.0 была представлена фирмой в 1998 году. Эта версия содержит существенные изменения в технологии хранения данных. В составе SQL Server 7.0 имелась утилита OLAP Services. Следующая версия SQL Server 2000 не несёт таких существенных изменений и отражает процесс дальнейшего совершенствования на базе SQL Server 7.0. Версии SQL Server 2005, SQL Server 2008 являются девятой и десятой версией SQL Server, представляющие собой завершённую и устойчивую платформу с расширенным набором средств оперативного и интеллектуального анализа данных [1,2].

Платформа SQL Server 2008

SQL Server 2008 является высокопроизводительной масштабируемой многофункциональной платформой, которая построена вокруг ядра, обеспечивающего работу реляционной базы данных (БД). Эта платформа включает большое количество сервисов и тесно интегрирована со всем комплексом программного обеспечения фирмы Microsoft (рисунок 3.1). СУБД и ряд ее сервисов являются ключевыми компонентами, обеспечивающими работу многих продуктов компании Microsoft.

Основными компоненты SQL Server 2008 являются:

§ основная служба (SQL Server 2008 Database Engine, SSDE), предназначенная для хранения, обработки и защиты данных, обеспечения управляемого доступа к данным и быстрой обработки транзакций;

§ сервисы интеграции (SQL Server Integration Services, SSIS), обеспечивающие извлечения, преобразования, загрузку данных в хранилище данных (ХД) и их интеграцию в масштабе предприятия;

§ аналитические сервисы(SQL Server Analysis Services, SSAS), предназначенные для анализа больших и смешанных наборов данных с использованием многомерного хранения кубов, решение задач ИАД;

§ сервисы отчетов (SQL Server Reporting Services, SSRS), предназначенные для создания, управления и доставки как интерактивных отчетов, основанных на Web-технологиях, так и бумажных отчётов;

Инструментальные средства администрирования и управления, разработки систем анализа данных (среды):

§ инструмент администрирования и управления (SQL Server Management Studio, SSMS), предназначенный для администрирования БД и управления многомерными объектами, созданными разработчиками;

§ инструмент разработки систем бизнес-анализа (SQL Server Business Intelligence Development Studio, BI Dev Studio) на основе SSAS, SSRS, SSIS, который интегрирован в оболочку Microsoft Visual Studio 2008;

Система Management Studio

Инструмент администрирования SSMS предназначен для администрирования ядра SQL Server, служб Integration Services, Analysis Services, Reporting Services и обеспечивает управление многомерными объектами, созданными разработчиками БД. Система SSMS разработана в виде единой консоли, поддерживающей функции управления, редактирования запросов и настройки производительности системы. Кроме того, консоль можно использовать для написания многомерных запросов на языке MDX или SQL, отправки запросов XMLA в Analysis Services.

При запуске SSMS пользователем появляется диалоговое окно Connect to Server, приведённое на рисунке 3.2. Диалоговое окно содержит три выпадающих списка. Первый выпадающий список указание типов доступных серверов: Database Engine, Analysis service, Reporting service, Integration service. По умолчанию из списка выбирается сервер Database Engine, обеспечивающий управление реляционными БД.

Management Studio не поддерживает работу с несколькими серверами одновременно. При необходимости переключения между серверами необходимо открыть несколько окон этой утилиты. В окне Object Explorer утилиты Management Studio  отображается структура выбранного сервера и информация об объектах БД. Management Studio поддерживает несколько редакторов:

§ редактор SQL Server запросов;

§ редактор Analysis запросов (MDX, DMX, XMLA);

§ редактор XML;

§ редактор обычного текста.

В настоящее время Structured Query Language (SQL) является стандартным языком определения и управления данными, хранящимися в реляционных БД. Этот язык содержит два подмножества инструкций. Первое подмножество инструкций называется языком определения данных (Data Definition Language, DDL), второе подмножество инструкция – языком манипулирования (обработки) данными (Data Manipulation Language, DML).

Инструкции DDL предназначены для создания объектов БД, построенных на основе реляционной модели. Инструкции DML предназначены для извлечения и обновления содержимого БД. Инструкция SELECT. Полный перечень инструкций рассматривается в работах [1, 2 ].

Одно из основных назначений языка XML состоит в обеспечении обмена данными между различными приложениями [1]. Большая популярность языка объясняется удобным форматом представления данных. Например, в тестовых файлах инструкция о структуре данных не хранится и небольшое изменение в формате может повлечь к некорректной работе приложения. С помощью XML можно создавать закрытые системы, обменивающиеся с внешней средой и не раскрывающие внутренней структуры данных в системе. Это достигается тем, что структура данных в файлах XML может не соответствовать структуре данных в системе.

Обозреватель объектов — компонент SQL Server Management Studio — может подключаться к экземплярам Database Engine, Analysis Services, Integration Services, Reporting Services и SQL Server Mobile. Он обеспечивает просмотр всех объектов сервера и предоставляет пользовательский интерфейс для управления ими. Возможности обозревателя объектов могут незначительно отличаться в зависимости от типа сервера, но в общем случае включают функции разработки для баз данных, а также функции управления для всех типов серверов.

В среде SQL Server Management Studio можно создавать различные типы проектов, предназначенные для сценариев служб Analysis Services и сценариев служб Database Engine. Сценарии служб Analysis Services содержат сценарии соединения с экземплярами служб Analysis Services, сценарии расширений интеллектуального анализа данных, многомерных выражений и выражений XML для служб Analysis Services. Сценарии Database Engine содержат сценарии Transact-SQL и XQuery для экземпляра компонента SQL Server 2008 Database Engine, сценарии соединения с экземплярами компонента SQL Server 2005 Database Engine.


Дата добавления: 2018-10-26; просмотров: 318; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!