Проверка надежности регрессионной модели.



Существуют две меры соответствия линии наименьших квадратов имеющимся данным. Стандартная ошибка оценки (или предсказания), которую обозначают , приблизительно указывает величину ошибок прогнозирования (остатков) для имеющихся данных в тех же единицах, в которых измерена и переменная У. Соответствующие формулы приведены ниже.

 (для вычисления)

 (для интерпретации).

Значение , часто называемое коэффициентом детерминации, говорит о том, какой процент вариации У объясняется поведением X .

Доверительные интервалы и проверка гипотез для коэффициента регрессии связаны с определенными предположениями относительно анализируемой сово­купности данных, которые должны гарантировать, что она состоит из независи­мых наблюдений, характеризующихся линейной взаимосвязью с равной вариа­цией и приблизительно нормально распределенной случайностью. Во-первых, эти данные должны представлять собой произвольную выборку из интересующей нас генеральной совокупности. Во-вторых, линейная модель указывает, что на­блюдаемое значение У определяется взаимосвязью в генеральной совокупности плюс случайная ошибка, имеющая нормальное распределение. Существуют па­раметры генеральной совокупности, соответствующие наклону и сдвигу линии наименьших квадратов, построенной на данных выборки:

Y = ( α+βХ)+ε = (Взаимосвязь в генеральной совокупности) + случайность.

 

где ε имеет нормальное распределение со средним значением, равным 0, и по­стоянным стандартным отклонением σ.

Статистические выводы (использование доверительных интервалов и проверки статистических гипотез) относительно коэффициентов линии наименьших квадратов основываются, как обычно, на их стандартных ошибках и значениях из t-таблицы для п - 2 степеней свободы.

Стандартная ошибка коэффициента наклона, , указывает приблизительную величину отклонения оценки наклона, b(коэффициент регрессии, вычисленный на основе данных выборки), от наклона в генеральной совокупности, β, вызванного случайным характером выборки. Стандартная ошибка сдвига, , указывает приблизительно, насколько далеко оценка сдвига аотстоит от истинного сдвига α в генеральной совокупности. Со­ответствующие формулы выглядят следующим образом:

стандартная ошибка коэффициента регрессии b :

стандартная ошибка сдвига: .

Доверительный интервал для наклона в генеральной совокупности, β:

от  до .

Доверительный интервал для сдвига в генеральной совокупности, α:

от  до .

Один из способов проверки, является ли обнаруженная взаимосвязь между X и У реальной или это просто случайное совпадение, заключается в сравнении β с заданным значением β 0 = 0. О значимой связи можно говорить в том случае, если 0 не попадает в доверительный интервал, базирующийся на bи Sb, или если абсолютное значение t = b / Sbпревосходит соответствующее t-значение в t-таблице.

t – таблица (t - критерий Стьюдента)

Доверительный интервал

Двухсторонний 80% 90% 95% 98% 99% 99,8% 99,9%
Односторонний 90% 95% 97,5% 99% 99,5% 99,9% 99,95%

Уровень значимости проверки гипотезы

Двухсторонний тест 0,20 0,10 0,05 0,02 0,01 0,002 0,001
Односторонний тест 0,10 0,05 0,025 0,01 0,005 0,001 0,0005
В целом: степени свободы

Критические значения t

1 3,078 6,314 12,706 31,821 63,657 318,309 636,619
2 1,886 2,920 4,303 6,965 9,925 22,327 31,599
3 1,638 2,353 3,182 4,541 5,841 10,215 12,924
4 1,533 2,132 2,776 3,747 4,604 7,173 8,610
5 1,476 2,015 2,571 3,365 4,032 5,893 6,869
6 1,440 1,943 2,447 3,143 3,707 5,208 5,959
7 1,415 1,895 2,365 2,998 3,499 4,785 5,408
8 1,397 1,860 2,306 2,896 3,355 4,505 5,041
9 1,383 1,833 2,262 2,821 3,250 4,297 4,781
10 1,372 1,812 2,228 2,764 3,169 4,144 4,587
11 1,363 1,796 2,201 2,718 3,106 4,025 4,437
12 1,356 1,782 2,179 2,681 3,055 3,930 4,318
13 1,350 1,771 2,160 2,650 3,012 3,852 4,221
14 1,345 1,761 2,145 2,624 2,977 3,787 4,140
15 1,341 1,753 2,131 2,602 2,947 3,733 4,073
38 1,304 1,686 2,024 2,429 2,712 3,319 3,566
39 1,304 1,685 1,023 2,426 2,708 3,313 3,558
Бесконечность 1,282 1,645 1,960 2,326 2,576 3,090 3,291

 

Эта проверка эквивалентна проверке значимости коэффициента корре­ляции и означает, по сути, то же самое, что и F-тест для случая, когда уравнение содержит только одну переменную X . Разумеется, любой из коэффициентов (a или b) можно сравнить с любым подходящим заданным значением, воспользовавшись одно- или двусто­ронней проверкой (в зависимости от конкретных обстоятельств) и с использова­нием тех же методов проверки, что были рассмотрены для среднего генеральной совокупности.

 

Прогнозирование.

Для прогнозирования сред­него значения нового наблюдения У при условии, что X = Х0, неопределенность прогноза оценивают с помощью стандартной ошибки прогноза S (прогнозируемое Y / X 0),  которая также имеет  п – 2 степеней свободы. Это позволяет построить до­верительные интервалы и проверить гипотезы для нового наблюдения:

Доверительный интервал для прогнозируемого (среднего) значения У при заданном значении Х0 имеет следующий вид:

от  до .

 


Дата добавления: 2022-01-22; просмотров: 19; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!