Требования к средствам оперативной аналитической обработки данных.



1. Многомерное концептуальное представление данных. Концептуальное представление модели данных в продукте OLAP должно быть многомерным по своей природе, то есть позволять аналитикам выполнять интуитивные операции "анализа вдоль и поперек" ("slice and dice"), вращения (rotate) и размещения (pivot) направлений консолидации.

2. Прозрачность. Пользователь не должен знать о том, какие конкретные средства используются для хранения и обработки данных, как данные организованы и откуда берутся.

3. Доступность. Аналитик должен иметь возможность выполнять анализ в рамках общей концептуальной схемы, но при этом данные могут оставаться под управлением оставшихся от старого наследства СУБД, будучи при этом привязанными к общей аналитической модели.

4. Устойчивая производительность. С увеличением числа измерений и размеров базы данных аналитики не должны столкнуться с каким бы то ни было уменьшением производительности.

5. Клиент - серверная архитектура. Главной идеей здесь является то, что серверный компонент инструмента OLAP должен быть достаточно интеллектуальным и обладать способностью строить общую концептуальную схему на основе обобщения и консолидации различных логических и физических схем корпоративных баз данных для обеспечения эффекта прозрачности.

6. Равноправие измерений. Все измерения данных должны быть равноправны. Дополнительные характеристики могут быть предоставлены отдельным измерениям, но поскольку все они симметричны, данная дополнительная функциональность может быть предоставлена любому измерению.

7. Динамическая обработка разреженных матриц. Инструмент OLAP должен обеспечивать оптимальную обработку разреженных матриц. Скорость доступа должна сохраняться вне зависимости от расположения ячеек данных и быть постоянной величиной для моделей, имеющих разное число измерений и различную разреженность данных.

8. Поддержка многопользовательского режима. 

9. Неограниченная поддержка кроссмерных операций. Вычисления и манипуляция данными по любому числу измерений не должны запрещать или ограничивать любые отношения между ячейками данных. Преобразования, требующие произвольного определения, должны задаваться на функционально полном формульном языке.

10. Интуитивное манипулирование данными.Переориентация направлений консолидации, детализация данных в колонках и строках, агрегация и другие манипуляции, свойственные структуре иерархии направлений консолидации, должны выполняться в максимально удобном, естественном и комфортном пользовательском интерфейсе.

11. Гибкий механизм генерации отчетов. Должны поддерживаться различные способы визуализации данных, то есть отчеты должны представляться в любой возможной ориентации.

12. Неограниченное количество измерений и уровней агрегации. Настоятельно рекомендуется допущение в каждом серьезном OLAP инструменте как минимум пятнадцати, а лучше двадцати, измерений в аналитической модели. Более того, каждое из этих измерений должно допускать практически неограниченное количество определенных пользователем уровней агрегации по любому направлению консолидации.

 

Общая классификация архитектур информационных приложений. ИАД.

                   Классификация

· Файл-серверные приложения

· Клиент-серверные приложения(информационная система, основанная на использовании серверов баз данных)

· Intranet-приложения

· Хранилища данных, системы оперативной аналитической обработки данных и интеллектуальный анализ данных

Интеллектуальный анализ данных (Data Mining) - это процесс поддержки принятия решений, основанный на поиске в данных скрытых закономерностей (шаблонов информации). При этом накопленные сведения автоматически обобщаются до информации, которая может быть охарактеризована как знания.

"Data mining- это процесс обнаружения в сырых данных

■ ранее неизвестных

■ нетривиальных

■ практически полезных

■ и доступных интерпретации знаний,

■ необходимых для принятия решений в различных сферах человеческой деятельности".

В общем случае процесс ИАД состоит из трёх стадий:

1) выявление закономерностей (свободный поиск);

2) использование выявленных закономерностей для предсказания неизвестных значений (прогностическое моделирование);

3) анализ исключений, предназначенный для выявления и толкования аномалий в найденных закономерностях.

Все методы ИАД подразделяются на две большие группы по принципу работы с исходными обучающими данными.

1. В первом случае исходные данные могут храниться в явном детализированном виде и непосредственно использоваться для прогностического моделирования и/или анализа исключений; это так называемые методы рассуждений на основе анализа прецедентов. Главной проблемой этой группы методов является затрудненность их использования на больших объемах данных

2. Во втором случае информация вначале извлекается из первичных данных и преобразуется в некоторые формальные конструкции (их вид зависит от конкретного метода).

 

 

Классификация поколений КИС.

В зависимости от степени использования стандартных понятий, методов и средств можно провести следующую классификацию поколений КИС.

1-e поколение:

а)использование индивидуальных моделей бизнес-процессов для отдельных предприятий или их типов; б) использование плоских файлов (или иерархических СУБД) и 3GL, в стиле IBM 360/370.

Примеры: уникальные системы металлургических компаний USX и British Steel, работающие только на конкретном предприятии.

2-е поколение:

а)использование типовой модели бизнес-процессов MRP/MRP II для любого типа предприятий; б) см. пункт 1. б плюс использование собственных средств разработки класса 4GL.

Примеры: базовые системы компаний Computer Associates, SAP и Baan.

3-e поколение:

а)развитие модели ERP (п. 2а). Применение реляционных СУБД ведущих производителей (Oracle, Sybase, Informix, Ingres и т.п.), основанных на международных стандартах SQL; б) отказ от использования индивидуальных средств разработки (применение унифицированных средств, основанных на SQL, включая типовые экранные формы, отчеты и т.д.); в)переход от идеологии мэйнфреймов к идеологии «клиент/сервер» и распределенным базам данных.

Примеры: базовые системы от Oracle, ESI/Technology, IFS; адаптации новых версий систем 2-го поколения в части использования некоторых возможностей типовых реляционных СУБД с сохранением собственных средств разработки и поддержки.

4-е поколение:

а)перенос типовых функций, процедур, триггеров с уровня приложений на уровень СУБД (использование возможностей нового поколения реляционных СУБД ведущих производителей); б)использование средств автоматизации проектирования и программирования (CASE) для поддержки «электронного проекта» на всех этапах его жизненного цикла; в) дальнейшая стандартизация и специализация бизнес-функций с выделением в самостоятельные прикладные модули средств поддержки хранилищ данных, OLAP и систем поддержки принятия решений; г) использование GUI, включая Web интерфейс.

Примеры: новые разработки фирм Decade Financials и Alcie, полностью построенные на Designer/2000 и Developer/2000; новые версии ERP систем от Oracle, ESI/Technology, IFS.

5-е поколение:

а)дальнейшая типизация метаданных, логических структур баз данных и описаний бизнес-функций на основе стандартов STEP и CORBA (включая UML);

б)выделение независимых объектно-ориентированных подсистем управления данными о продукции, а также технологий, основанных на стандартах STEP и CORBA (PDM системы 2-го поколения); в)создание репозитария стандартных компонентов бизнес-объектов и функций для «сборки» прикладных систем и их «перекомпоновки» (для «реинжиниринга бизнес-процессов» при внедрении ERP системы); г) выделение независимых объектно-ориентированных подсистем сервисного обслуживания и администрирования, основанных на идеологии ORB и DCOM. д) использование корпоративных и глобальных сетей для создания «виртуальных» производств и предприятий.

 


Дата добавления: 2018-02-18; просмотров: 171; ЗАКАЗАТЬ РАБОТУ