Мастер интеллектуального анализа данных
Мастер ИАД данных в службах Analysis Services запускается каждый раз при добавлении новой структуры ИАД к проекту интеллектуального анализа данных. Мастер помогает определить новые структуры ИАД и выбирает источники данных, которые будут использованы для ИАД. Мастер также может разбить данные структуры ИАД на обучающие и проверочные наборы и для каждой структуры позволяет добавить исходную модель ИАД.
Содержимое структуры ИАД выводится на основе существующего представления источника данных или куба. Мастер предлагает выбрать столбцы для включения в структуру ИАД. Эти столбцы могут использоваться всеми моделями на основе данной структуры. Можно также позволить пользователям модели ИАД детализировать результаты модели углублением с целью просмотра дополнительных столбцов структуры ИАД, не включенных в саму модель.
Во время создания структур и моделей ИАД с помощью мастера ИАД можно принять следующие решения:
§ Определить, на основе чего будет построена структура и модель ИАД: на основе реляционной базы данных или на основе существующего куба в базе данных OLAP;
§ Определить объем данных, который будет использоваться для обучения, и объем, который будет использоваться для проверки. После разбиения данных на обучающий и проверочный набор эти данные могут быть использованы всеми моделями на основе данной структуры;
§ Определить, какие столбцы или атрибуты будут использоваться для прогноза, а какие будут входными данными для анализа. Кроме того, в каждой структуре должен присутствовать ключ, однозначно идентифицирующий запись варианта;
|
|
§ Определить используемый алгоритм, предусмотренный службами SQL Server Analysis Services и отличающийся своими характеристиками. Можно создать несколько моделей на основе различных алгоритмов или изменить параметры алгоритмов.
После завершения работы мастера ИАД с помощью конструктора ИАД можно изменить структуру и модели ИАД, просмотреть точность модели, просмотреть характеристики структуры и моделей или выполнить прогнозирование с использованием этих моделей.
Для запуска мастера ИАД следует добавить новую структуру ИАД к проекту служб Analysis Services, используя обозреватель решений или меню Проект в среде BI Dev Studio.
Мастер интеллектуального анализа данных имеет две ветви, в зависимости от того, содержатся ли данные в реляционном источнике данных или в кубе. При построении модели ИАД на основе реляционного источника данных в службах Analysis Services сначала в мастере ИАД указывается, что необходимо использовать существующую реляционную БД для определения структуры этой модели. Кроме того, можно создать только структуру ИАД или структуру и одну связанную с ней модель ИАД. Если выбрано создание модели ИАД, то необходимо указать используемый метод анализа.
|
|
На последующих шагах осуществляется выбор конкретного представления источника данных, которое необходимо использовать для определения структуры ИАД, а также указание таблицы вариантов. Таблица вариантов будет использоваться для обучения модели ИАД, а при необходимости её можно использовать и для ее проверки.
Выбор таблицы вариантов представляет собой важное решение при анализе. Таблица должна содержать сущности для анализа. Вложенные таблицы содержат, как правило, дополнительные сведения о сущностях таблицы вариантов, например транзакции, осуществляемые заказчиком, или атрибуты, имеющие с сущностью связь «многие к одному». После указания таблицы вариантов и вложенных таблиц определяется тип использования для каждого столбца в таблицах, которые будут включены в структуру ИАД. Если для столбца не указан тип использования, то этот столбец не будет включен в структуру ИАД.
Столбцы ИАД могут быть ключевыми, входными, прогнозируемыми или комбинацией входного и прогнозируемого ключа. Ключевые столбцы содержат уникальный идентификатор для каждой строки в таблице. Некоторые модели ИАД, основанные на алгоритмах кластеризации последовательностей и временных рядов, могут содержать несколько ключевых столбцов. Однако эти несколько ключей не являются составными в реляционном смысле, а должны быть выбраны для обеспечения поддержки анализа временных рядов и кластера последовательностей. Входные столбцы предоставляют данные, на основе которых осуществляется прогнозирование. Прогнозируемые столбцы содержат данные, которые прогнозирует модель ИАД.
|
|
Мастер ИАД предоставляет функцию Предложить, которая включается при выборе прогнозируемого столбца. Наборы данных часто содержат больше столбцов, чем нужно использовать при построении модели ИАД. Функция Предложить вычисляет численный показатель, от 0 до 1, описывающий связь между каждым столбцом в наборе данных и прогнозируемым столбцом. На основе этого показателя функция предполагает столбцы для использования в качестве входных для модели интеллектуального анализа данных. При использовании функции Предложить можно использовать предполагаемые столбцы, изменить выбор в соответствии с потребностями или пропустить предположения. После выбора одного или нескольких прогнозируемых и входных столбцов можно указать типы содержимого и данных для каждого из них.
|
|
Последним шагом перед завершением работы мастера является секционирование данных на обучающие и проверочные наборы. Возможность удерживать часть данных для проверки реализована в версии SQL Server 2008 впервые и представляет собой простой механизм, обеспечивающий доступность согласованного набора проверочных данных для использования со всеми моделями ИАД, связанными с новой структурой. Можно указать в процентах, какая часть данных должна использоваться для проверки, и остальные данные будут использованы для обучения. Также можно указать количество вариантов, которые будут использоваться для проверки.
На последнем шаге выполнения мастера указываются имена структуры ИАД и связанной с ней модели. При выборе параметра разрешить детализацию в модели включается функция детализации. Это позволяет пользователям, имеющим соответствующие разрешения, просматривать исходные данные, которые были использованы для построения модели.
При построении модели ИАД на основе источника данных OLAP в службах Analysis Services сначала в мастере указывается, что необходимо использовать существующий куб для определения структуры модели. Можно также создать только структуру ИАД или структуру и одну связанную с ней модель. Если выбрано создание модели, то указывается используемый способ ИАД, определяющий алгоритм, наилучшим образом подходящий для решения задачи.
Дата добавления: 2018-10-26; просмотров: 212; Мы поможем в написании вашей работы! |

Мы поможем в написании ваших работ!