Принципы репликации



 

Репликация — это набор технологий, который позволяет поддерживать несколько копий одних и тех же данных на нескольких узлах, число которых иногда может достигать нескольких сотен. Для распределения данных при репликации используется модель публикации и подписки.

Издателем является сервер-источник данных, подлежащих репликации. Для каждой таблицы или иного объекта базы данных, который предполагается использовать и качестве источника репликации, издатель определяет статью. Одна или несколько связанных статей из одной базы данных организуются в публикацию. Публикации представляют собой удобный способ группировки связанных данных и объектов, которые следует реплицировать.

Подписчиком является сервер, который получает данные, реплицируемые издателем.

Подписчик определяет подписку на определенную публикацию. В подписке указан срок получения подписчиком публикации и сведения о соответствии между статьями публикации и таблицами или другими объектами подписчика.

Дистрибьютор — это сервер, выполняющий различные задачи по перемещению статей от издателей к подписчикам. Реальные задачи зависят от типа выполняемой репликации.

SQL Server 2000 также поддерживает репликацию между гетерогенными источниками данных. Источники данных OLE DB или ODBC могут подписываться на публикации SQL Server. Последний также способен получать данные, реплицируемые некоторыми другими источниками данных, в том числе Microsoft Exchange, Microsoft Access, Oracle и DB2.

 

 

Хранилища данных и оперативная аналитическая обработка (OLAP)

 

SQL Server 2000 содержит компоненты, позволяющие создавать хранилища и киоски данных. Хранилища и киоски данных можно использовать в сложных промышленных системах искусственного интеллекта, обрабатывающих запросы, которые применяются для выявления трендов и анализа критических факторов. Эти системы называются системами оперативной аналитической обработки (Online Analytical Processing, OLAP). Данные в хранилищах и киосках данных организованы иначе, чем в традиционных базах данных, работающих с транзакциями.

ПО управления реляционными базами данных промышленного уровня, например SQL Server 2000, изначально разрабатывалось для централизованного хранения данных, генерируемых ежедневными транзакциями крупных компаний или правительственных организаций. За десятилетия эволюции эти СУБД превратились в высокоэффективные системы регистрации данных, необходимые для ежедневной работы предприятия. Такие системы получили название систем оперативной обработки транзакций (Online Transaction Processing, OLTP).

 

OLTP-системы

 

Данные в OLTP-системах организованы главным образом для поддержки таких транзакций, как:

· регистрация заказа, введенного с кассового терминала или через ^Ь-узел;

· размещение заказа на комплектующие изделия, когда их количество на складе становится меньше определенного числа;

· отслеживание компонентов во время сборки конечного продукта на производстве;

· регистрация сведений о работниках;

· регистрация идентификационных данных держателей лицензий, например владельцев ресторанов или водителей.

Отдельные транзакции, обращаясь к относительно небольшому объему данных, завершаются быстро. Системы OLTP созданы и оптимизированы для одновременной обработки сотен и тысяч транзакций.

OLTP-системы превосходно выполняют регистрацию данных, необходимых для поддержки ежедневных операций. Однако данные в них организованы иначе, чем это необходимо в том случае, когда информация предназначена менеджерам для планирования работы их организаций. Менеджерам часто нужна итоговая информация — для анализа трендов, влияющих на вверенную им организацию или группу.

 

 

OLAP-системы

 

Системы для обработки запросов, предназначенных для выявления трендов и критических факторов, называются OLAP-системами, Как правило, запросы OLAP извлекают большой объем данных. Например, начальнику правительственного отдела по выдаче водительских прав, может понадобиться отчет по маркам и моделям автомобилей, которые регистрировались ежегодно в течение последних 20 лет. При выполнении запроса такого типа в системе OLTP:

· значительное время потребуется на агрегацию (суммирование) всех подробных записей за последние 20 лет, так что отчет не будет подготовлен вовремя;

· нагрузка на систему возрастет, что приведет, по меньшей мере, к замедлению работы обычных пользователей и нарушит ритм регистрации транзакций.

Другая проблема в том, что на многих больших предприятиях существует несколько OLTP-систем, регистрирующих данные всех транзакций. Многие из них создавались в разное время и на основе различного программного и аппаратного обеспечения. Очень часто коды и имена, которые используются для идентификации элементов одной системы, отличаются от таковых в другой системе. Менеджерам, выполняющим запросы OLAP, в общем случае необходимо предоставить возможность работы с данными из нескольких систем OLTP.

Системы оперативной аналитической обработки используют данные OLAP, которые находятся в хранилищах или киосках данных. В хранилище данных находятся данные OLAP уровня предприятия, в то время как размер киоска данных меньше, и как правило данные киоска относятся лишь к одной из функций организации.

 

 


Дата добавления: 2015-12-17; просмотров: 22; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!