Раздел 4. Загрузка данных и программирование запросов



Лекция 11. Загрузка данных в Analysis Services

В лекции рассматриваются вопросы реализации процедур оперативного (OLAP) и интеллектуального (Data Mining) анализа данных с использованием клиентских и серверных технологий.

Цель лекции – изучение методики, программных средств создания и представления источника данных, загрузки данных в Analysis Services  с применением Integration Services.

 

Построение многомерной модели данных

Построение многомерной модели данных выполняется с применением языка определения данных (DDL). Описание модели может быть выполнено с использованием любого текстового редактора. При этом от разработчика требуется глубокое знание языка и концепций построения модели. Среда BI Dev Studio представляет пользовательский интерфейс, который значительно облегчает построение модели данных. Описание модели храниться в XML-файлах на диске в директории проекта модели данных. Изменения в описании модели отражаются в пользовательском интерфейсе. Например, если изменения в редакторе XML касались измерения, то эти изменения будут отражены в редакторе измерений.

Построение модели связано с выполнением следующих операций:

§ разработка и редактирование источника данных;

§ разработка и редактирование представления источника данных;

§ создание и модификация измерений модели;

§ создание и модификация куба модели;

§ создание перспектив куба модели;

§ определение переводов для куба модели;

§ развёртывание куба модели в среде Analysis Services.

Среда BI Dev Studio поддерживает копирование определения объектов одной модели и вставку их в другую модель.

Создание и представление источника данных

Построение многомерной модели осуществляется в несколько этапов. На первом этапе создаётся источник данных, который определяет способ подключения Analysis Services к реляционной БД и другим источникам. Для создания источника используется Мастер Источника Данных (Data Source Wizard) в BI Dev Studio. Источником данных служб Analysis Services является объект, предоставляющий службе сведения, необходимые для подключения к источнику данных для решения задач анализа данных. Службы Analysis Services могут получить доступ к данным источников данных при условии, что у служб Analysis Services имеется возможность создавать запросы OLAP или запросы интеллектуального анализа данных [1].

Среда SQL Server Analysis Services поддерживает различные типы поставщиков. При определении  поставщика, следует указать данные о соединении, необходимые данному поставщику для подключения к БД. Содержание данных зависит от выбранного поставщика. Как правило, требуется указать сервер или экземпляр службы, учетные данные для входа, имя БД или файла и другие параметры, относящиеся к конкретному поставщику.

Определить источник данных можно на основе нового или существующего соединения. При работе с проектом служб Analysis Services определить источник данных можно также на основе другого объекта проекта или решения. По умолчанию для нового соединения применяется поставщик OLE DB собственного клиента SQL Server. Этот поставщик обеспечивает соединение с экземпляром компонента SQL Server Database Engine и обеспечивает высокой уровень производительности соединения. Для создания источника данных на основе уже существующего источника следует просто скопировать все свойства существующего источника данных в новый объект. После создания источника можно изменить его свойства.

Проекты оперативной аналитической обработки (OLAP) и интеллектуального анализа данных на сервере Microsoft SQL Server разрабатываются на основе логической модели данных связанных таблиц, представлений и запросов из одного или нескольких источников данных. Эта логическая модель называется представлением источников данных. Представление источника данных является объектом, содержащим метаданные из выбранных объектов источника данных, включая связи между этими объектами, определенные в базовом источнике данных или в представлении источника данных. Представление источника данных кэширует метаданные из источников данных, на основе которых оно построено. Кэшированные метаданные позволяют разработать проект служб Analysis Services без непрерывного активного соединения с источником данных.

Представления источников данных определяют подмножество данных, заполняющих большое хранилище данных. За счёт представлений задаётся однородная схема на основе разнородных источников данных или подмножеств источников данных. Схема представления источников данных является изолированным объектом, и к ней можно добавлять новые заметки, не затрагивая схемы в базовых источниках данных.

Состав элементов представления следующее: имя и описание, определение элементов схемы, заметки к схеме из базовых источников данных. Определение элементов схемы включает имена таблиц, имена столбцов, типы данных, допустимость значений NULL, указание длины столбцов, первичные ключи, связи «первичный ключ — внешний ключ».

Заметки к схеме из базовых источников данных содержат: понятные имена таблиц, представлений и столбцов; именованные запросы, возвращающие столбцы из одного или нескольких источников данных; именованные вычисления, возвращающие столбцы из источника данных; логические первичные ключи; связи «первичный ключ - внешний ключ» между таблицами, представлениями и именованными запросами.

С помощью описания подмножества таблиц в источнике данных представление источника данных делает доступными только те таблицы, которые необходимы для объектов OLAP и ИАД. Представление источника данных управляет макетом таблиц, фильтров, SQL-выражений, связей и других сложных элементов схемы. За счёт создания представления источника данных упрощается привязка кубов, измерений и моделей ИАД служб Analysis Services к таблицам и столбцам источника данных. Построение нескольких представлений источника данных в одном проекте Analysis Services позволяет выполнить требования при различных решениях.


Дата добавления: 2018-10-26; просмотров: 232; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!