Продвинутый регрессионный анализ



В этой теме рассмотрим более мощные и научно обоснованные методы анализа свойств уравнения регрессии, основанные на технологии проверки статистических гипотез. Основное допущение метода: экспериментальные ошибки (компоненты вектора e) независимы и распределены нормально.

Проверка значимости МНК-оценок

Def . Если b j = 0, то говорят, что МНК-оценка  незначима.

Это означает, что член bj ×fj (x) не должен входить в модель.

Выдвинем гипотезу Н0: bj = 0. При верной гипотезе  Н0 случайные величины

, j = 1, …, k,                      (3.3)

где = (ФTФ)–1 , имеют распределение Стьюдента с числом степеней свободы n = N k. Критическая область имеет двухстороннюю структуру: если  > ТКРИТ = qt(1– a/2, Nk), то гипотеза не верна и МНК-оценка  значима.

Проверка эффективности регрессии. Пусть регрессионная модель содержит свободный член b0. Предположим, что влияние на выходной параметр у контролируемых входных параметров х j незначимо на фоне случайных помех. Этот факт можно сформулировать в виде статистической гипотезы Н0: bj = 0 " j ¹ 0. В отличие от предыдущего пункта, речь идет не об отдельных членах модели, а об уравнении в целом.

Def . Если гипотеза Н0 верна, то будем говорить, что модель неэффективна.

При верной гипотезе Н0: bj = 0 " j ¹ 0 статистика

                                  (3.4)

имеет распределение Фишера с числами степеней свободы k – 1 и Nk.

Таким образом, для проверки эффективности модели может быть использован статистический критерий (3.4) с правосторонней критической областью: если FВЫЧ > FКРИТ = qF(1 – a, k –1, N – k),  то гипотеза не верна и модель эффективна.

Оценка статистической адекватности модели. Адекватность уравнения регрессии можно проверить только при наличии параллельных опытов. Пусть их число равно L. Введем следующие величины, которые назовем точечными дисперсиями

.                                      (3.5)

Каждая из них оценивает разброс значений выходного параметра под действием неконтролируемых случайных факторов в i–й экспериментальной точке. Обозначим

                                        (3.6)

дисперсия воспроизводимости, которая характеризует средний разброс значений выходного параметра по области его значений.

Также введем следующую величину

                               (3.7)

дисперсию адекватности, представляющую собой аналог остаточной дисперсии, используемый при наличии параллельных опытов.

Гипотеза Н0 о статистической адекватности регрессии проверяется с помощью критерия Фишера

                                           (3.8)

Если FВЫЧ < FКРИТ = qF(1–a, Nk, N×(L–1)),  то гипотеза верна и регрессия адекватна.

Однородность точечных дисперсий. Напомним, что, согласно теореме Гаусса-Маркова (условие 1), всё перечисленные выше методы справедливы только при условии постоянства значения s2. Соответствующее предположение также можно сформулировать в виде статистической гипотезы, которая проверяется с помощью критерия Кочрена:

,                                           (3.9)

где – точечные дисперсии, вычисляемые по формуле (3.5); – максимальная из . Если GВЫЧ < GТАБЛ (a, N, L – 1), то гипотеза о постоянстве значения s2 признается верной. В этом случае также говорят, что точечные дисперсии однородны.

Замечание. Поскольку в MathCad отсутствует функция для определения критических значений критерия Кочрена GТАБЛ (a, N, L – 1), то предлагается для их нахождения воспользоваться таблицей из ПРИЛОЖЕНИЯ 2.

С помощью  можно также проверить значимость коэффициентов модели без предположения об её адекватности. Для этого также используется критерий Стьюдента, но формула другая:

                                      (3.10)

с числом степеней свободы n = N(L – 1), где = (ФT Ф)–1 и критической областью вида  > ТКРИТ = qt(1–a/2, N(L – 1)).


Дата добавления: 2019-02-26; просмотров: 174; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!