Матричный подход к регрессивному анализу. Матрица дисперсий-ковариаций



Регрессионный анализ. Метод наименьших квадратов (МНК)

Экспериментальное исследование зависимости физических величин, влияния условий на свойства и поведение исследуемых систем и соединений является весьма важной задачей в области химических исследований. Эта задача возникает в самых различных областях химии и позволяет решать многие проблемы, например:

1) Задача построения калибровочных зависимостей, по которым можно прогнозировать значение условий, которые обеспечивают определенный результат.

2) Определение важных физико-химических характеристик системы – например, зависимость свободной энергии системы от температуры будет линейной, а ее наклон равен изменению энтропии системы с отрицательным знаком.

3) Еще одна задача – сжатие (компактизация данных), когда подобранная функция используется для описания (аппроксимации) огромного массива экспериментальных данных (например, зависимость теплоемкости от температуры можно представить в виде функции, и в справочниках приводят не экспериментальную таблицу зависимости Cp от T, а коэффициенты выбранной функции).

4) Аппроксимация экспериментальных данных функцией с целью поиска точек минимума (максимума) – задача оптимизации.

Статистический анализ

Перейдем к статистическому анализу в матричной форме.

Будем предполагать, что постулаты регрессионного анализа выполняются.

Первый постулат. Параметр оптимизации y есть случайная величина с нормальным законом распределения. Дисперсия воспроизводимости – одна из характеристик этого закона распределения.

В данном случае, как и по отношению к любым другим постулатам, нас интересуют два вопроса: как проверить его выполнимость и к чему приводят его нарушения?

При наличии большого экспериментального материала (десятки параллельных опытов) гипотезу о нормальном распределении можно проверить стандартными статистическими тестами (например, χ2– критерием). К сожалению, экспериментатор редко располагает такими данными, поэтому приходится принимать этот постулат на веру.

Второй постулат. Дисперсия y не зависит от абсолютной величины y. Выполнимость этого постулата проверяется с помощью критериев однородности дисперсий в разных точках факторного пространства. Нарушение этого постулата недопустимо.

Всегда существует такое преобразование y, которое делает дисперсии однородными. Увы, его не всегда легко найти. Довольно часто помогает логарифмическое преобразование, с которого обычно начинают поиски.

Третий постулат. Значения факторов суть неслучайные величины. Это несколько неожиданное утверждение практически означает, что установление каждого фактора на заданный уровень и его поддержание существенно точнее, чем сшибка воспроизводимости.

Нарушение этого постулата приводит к трудностям при реализации матрицы планирования. Поэтому оно обычно легко обнаруживается экспериментатором.

Существует еще четвертый постулат, налагающий ограничения на взаимосвязь между значениями факторов. Что значит провести статистический анализ? Это значит проверить ряд статистических гипотез: гипотезу об адекватности заданной модели, гипотезу о значимости отдельных коэффициентов регрессии и др. Фундаментальную роль в анализе уравнения регрессии играет матрица

M–1=(XTX )–1,

которая называется матрицей дисперсий ковариаций. Прямая матрица М называется информационной матрицей Фишера.

В структуре матрицы дисперсий-ковариаций содержится вся информация о статистических свойствах модели. Провести статистический анализ значит извлечь эту информацию. Для этого прежде всего перейдем от матрицы, обратной к матрице системы нормальных уравнений, к матрице М–1. Оценка дисперсии воспроизводимости  – скаляр; ХТХ – квадратная матрица.

На главной диагонали матрицы-произведения стоят оценки дисперсий коэффициентов регрессии, вне главной диагонали расположены оценки ковариаций.

Ковариация определяется по формуле

Экзаменационный билет 12

1. Полный факторный эксперимент типа 2к. Геометрическая интерпритация полного факторного эксперимента.

Полным факторным экспериментом называется эксперимент, в котором реализуют все возможные сочетания уровней факторов. Полный факторный эксперимент основан на варьировании факторов на двух уровнях. Если число факторов известно, то можно сразу найти число опытов, необходимых для реализации всех возможных сочетаний уровней факторов, по формуле:

N = 2k,

где N – число опытов; 2 – число уровней; k – число факторов.

Номер опыта Х1 Х2 Х3 Y
 1 - - - Y1
2 + - - Y2
3 - + - Y3
4 + + - Y4
5 - - + Y5
6 + - + Y6
7 - + + Y7
8 + + + Y8

 ПРИМЕР: Матрица полного факторного эксперимента 23 и 22

Свойства:

· Симметричность относительно центра - алгебраическая сумма элементов вектор-столбца каждого фактора равна нулю

где j-номер фактора, i- номер опыта, N- число опытов

 

· Условие нормировки - сумма квадратов элементов каждого столбца равна числу опытов

 

· Ортогональность матрицы - сумма почленных произведений любых двух вектор-столбцов матрицы равна нулю

Геометрической интерпретацией полного факторного эксперимента 23 служит куб, координаты вершин которого задают условия опытов. Если поместить центр куба в точку основного уровня факторов, а масштабы по осям выбрать так, чтобы интервал варьирования равнялся единице, то получится куб. Куб задает область эксперимента, а центр куба является ее центром. 

Геометрическая интерпретация полного факторного эксперимента 22: найдем в области определения факторов точку, соответствующую основному уровню, и проведем через нее новые оси координат, параллельные осям натуральных значений факторов. Далее, выберем масштабы по новым осям так, чтобы интервал варьирования для каждого фактора равнялся единице. Тогда условия проведения опытов будут соответствовать вершинам квадрата, центром которого является основной уровень, а каждая сторона параллельна одной из осей координат и равна двум интервалам (рис.). Номера вершин квадрата соответствуют номерам опытов в матрице планирования. Площадь, ограниченная квадратом, называется областью эксперимента.


Дата добавления: 2018-04-04; просмотров: 640; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!