Продвинутый регрессионный анализ
В этой теме рассмотрим более мощные и научно обоснованные методы анализа свойств уравнения регрессии, основанные на технологии проверки статистических гипотез. Основное допущение метода: экспериментальные ошибки (компоненты вектора e) независимы и распределены нормально.
Проверка значимости МНК-оценок
Def . Если b j = 0, то говорят, что МНК-оценка незначима.
Это означает, что член bj ×fj (x) не должен входить в модель.
Выдвинем гипотезу Н0: bj = 0. При верной гипотезе Н0 случайные величины
, j = 1, …, k, (3.3)
где = (ФTФ)–1 , имеют распределение Стьюдента с числом степеней свободы n = N – k. Критическая область имеет двухстороннюю структуру: если > ТКРИТ = qt(1– a/2, N – k), то гипотеза не верна и МНК-оценка значима.
Проверка эффективности регрессии. Пусть регрессионная модель содержит свободный член b0. Предположим, что влияние на выходной параметр у контролируемых входных параметров х j незначимо на фоне случайных помех. Этот факт можно сформулировать в виде статистической гипотезы Н0: bj = 0 " j ¹ 0. В отличие от предыдущего пункта, речь идет не об отдельных членах модели, а об уравнении в целом.
Def . Если гипотеза Н0 верна, то будем говорить, что модель неэффективна.
При верной гипотезе Н0: bj = 0 " j ¹ 0 статистика
(3.4)
имеет распределение Фишера с числами степеней свободы k – 1 и N – k.
Таким образом, для проверки эффективности модели может быть использован статистический критерий (3.4) с правосторонней критической областью: если FВЫЧ > FКРИТ = qF(1 – a, k –1, N – k), то гипотеза не верна и модель эффективна.
|
|
Оценка статистической адекватности модели. Адекватность уравнения регрессии можно проверить только при наличии параллельных опытов. Пусть их число равно L. Введем следующие величины, которые назовем точечными дисперсиями
. (3.5)
Каждая из них оценивает разброс значений выходного параметра под действием неконтролируемых случайных факторов в i–й экспериментальной точке. Обозначим
(3.6)
– дисперсия воспроизводимости, которая характеризует средний разброс значений выходного параметра по области его значений.
Также введем следующую величину
(3.7)
– дисперсию адекватности, представляющую собой аналог остаточной дисперсии, используемый при наличии параллельных опытов.
Гипотеза Н0 о статистической адекватности регрессии проверяется с помощью критерия Фишера
(3.8)
Если FВЫЧ < FКРИТ = qF(1–a, N– k, N×(L–1)), то гипотеза верна и регрессия адекватна.
|
|
Однородность точечных дисперсий. Напомним, что, согласно теореме Гаусса-Маркова (условие 1), всё перечисленные выше методы справедливы только при условии постоянства значения s2. Соответствующее предположение также можно сформулировать в виде статистической гипотезы, которая проверяется с помощью критерия Кочрена:
, (3.9)
где – точечные дисперсии, вычисляемые по формуле (3.5); – максимальная из . Если GВЫЧ < GТАБЛ (a, N, L – 1), то гипотеза о постоянстве значения s2 признается верной. В этом случае также говорят, что точечные дисперсии однородны.
Замечание. Поскольку в MathCad отсутствует функция для определения критических значений критерия Кочрена GТАБЛ (a, N, L – 1), то предлагается для их нахождения воспользоваться таблицей из ПРИЛОЖЕНИЯ 2.
С помощью можно также проверить значимость коэффициентов модели без предположения об её адекватности. Для этого также используется критерий Стьюдента, но формула другая:
(3.10)
с числом степеней свободы n = N(L – 1), где = (ФT Ф)–1 и критической областью вида > ТКРИТ = qt(1–a/2, N(L – 1)).
Дата добавления: 2019-02-26; просмотров: 174; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!