Проверка надежности регрессионной модели.
Существуют две меры соответствия линии наименьших квадратов имеющимся данным. Стандартная ошибка оценки (или предсказания), которую обозначают , приблизительно указывает величину ошибок прогнозирования (остатков) для имеющихся данных в тех же единицах, в которых измерена и переменная У. Соответствующие формулы приведены ниже.
(для вычисления)
(для интерпретации).
Значение , часто называемое коэффициентом детерминации, говорит о том, какой процент вариации У объясняется поведением X .
Доверительные интервалы и проверка гипотез для коэффициента регрессии связаны с определенными предположениями относительно анализируемой совокупности данных, которые должны гарантировать, что она состоит из независимых наблюдений, характеризующихся линейной взаимосвязью с равной вариацией и приблизительно нормально распределенной случайностью. Во-первых, эти данные должны представлять собой произвольную выборку из интересующей нас генеральной совокупности. Во-вторых, линейная модель указывает, что наблюдаемое значение У определяется взаимосвязью в генеральной совокупности плюс случайная ошибка, имеющая нормальное распределение. Существуют параметры генеральной совокупности, соответствующие наклону и сдвигу линии наименьших квадратов, построенной на данных выборки:
Y = ( α+βХ)+ε = (Взаимосвязь в генеральной совокупности) + случайность.
|
|
где ε имеет нормальное распределение со средним значением, равным 0, и постоянным стандартным отклонением σ.
Статистические выводы (использование доверительных интервалов и проверки статистических гипотез) относительно коэффициентов линии наименьших квадратов основываются, как обычно, на их стандартных ошибках и значениях из t-таблицы для п - 2 степеней свободы.
Стандартная ошибка коэффициента наклона, , указывает приблизительную величину отклонения оценки наклона, b(коэффициент регрессии, вычисленный на основе данных выборки), от наклона в генеральной совокупности, β, вызванного случайным характером выборки. Стандартная ошибка сдвига, , указывает приблизительно, насколько далеко оценка сдвига аотстоит от истинного сдвига α в генеральной совокупности. Соответствующие формулы выглядят следующим образом:
стандартная ошибка коэффициента регрессии b :
стандартная ошибка сдвига: .
Доверительный интервал для наклона в генеральной совокупности, β:
от до .
Доверительный интервал для сдвига в генеральной совокупности, α:
от до .
Один из способов проверки, является ли обнаруженная взаимосвязь между X и У реальной или это просто случайное совпадение, заключается в сравнении β с заданным значением β 0 = 0. О значимой связи можно говорить в том случае, если 0 не попадает в доверительный интервал, базирующийся на bи Sb, или если абсолютное значение t = b / Sbпревосходит соответствующее t-значение в t-таблице.
|
|
t – таблица (t - критерий Стьюдента)
Доверительный интервал | |||||||
Двухсторонний | 80% | 90% | 95% | 98% | 99% | 99,8% | 99,9% |
Односторонний | 90% | 95% | 97,5% | 99% | 99,5% | 99,9% | 99,95% |
Уровень значимости проверки гипотезы | |||||||
Двухсторонний тест | 0,20 | 0,10 | 0,05 | 0,02 | 0,01 | 0,002 | 0,001 |
Односторонний тест | 0,10 | 0,05 | 0,025 | 0,01 | 0,005 | 0,001 | 0,0005 |
В целом: степени свободы | Критические значения t | ||||||
1 | 3,078 | 6,314 | 12,706 | 31,821 | 63,657 | 318,309 | 636,619 |
2 | 1,886 | 2,920 | 4,303 | 6,965 | 9,925 | 22,327 | 31,599 |
3 | 1,638 | 2,353 | 3,182 | 4,541 | 5,841 | 10,215 | 12,924 |
4 | 1,533 | 2,132 | 2,776 | 3,747 | 4,604 | 7,173 | 8,610 |
5 | 1,476 | 2,015 | 2,571 | 3,365 | 4,032 | 5,893 | 6,869 |
6 | 1,440 | 1,943 | 2,447 | 3,143 | 3,707 | 5,208 | 5,959 |
7 | 1,415 | 1,895 | 2,365 | 2,998 | 3,499 | 4,785 | 5,408 |
8 | 1,397 | 1,860 | 2,306 | 2,896 | 3,355 | 4,505 | 5,041 |
9 | 1,383 | 1,833 | 2,262 | 2,821 | 3,250 | 4,297 | 4,781 |
10 | 1,372 | 1,812 | 2,228 | 2,764 | 3,169 | 4,144 | 4,587 |
11 | 1,363 | 1,796 | 2,201 | 2,718 | 3,106 | 4,025 | 4,437 |
12 | 1,356 | 1,782 | 2,179 | 2,681 | 3,055 | 3,930 | 4,318 |
13 | 1,350 | 1,771 | 2,160 | 2,650 | 3,012 | 3,852 | 4,221 |
14 | 1,345 | 1,761 | 2,145 | 2,624 | 2,977 | 3,787 | 4,140 |
15 | 1,341 | 1,753 | 2,131 | 2,602 | 2,947 | 3,733 | 4,073 |
… | … | … | … | … | … | … | … |
… | … | … | … | … | … | … | … |
38 | 1,304 | 1,686 | 2,024 | 2,429 | 2,712 | 3,319 | 3,566 |
39 | 1,304 | 1,685 | 1,023 | 2,426 | 2,708 | 3,313 | 3,558 |
Бесконечность | 1,282 | 1,645 | 1,960 | 2,326 | 2,576 | 3,090 | 3,291 |
|
|
Эта проверка эквивалентна проверке значимости коэффициента корреляции и означает, по сути, то же самое, что и F-тест для случая, когда уравнение содержит только одну переменную X . Разумеется, любой из коэффициентов (a или b) можно сравнить с любым подходящим заданным значением, воспользовавшись одно- или двусторонней проверкой (в зависимости от конкретных обстоятельств) и с использованием тех же методов проверки, что были рассмотрены для среднего генеральной совокупности.
|
|
Прогнозирование.
Для прогнозирования среднего значения нового наблюдения У при условии, что X = Х0, неопределенность прогноза оценивают с помощью стандартной ошибки прогноза S (прогнозируемое Y / X 0), которая также имеет п – 2 степеней свободы. Это позволяет построить доверительные интервалы и проверить гипотезы для нового наблюдения:
Доверительный интервал для прогнозируемого (среднего) значения У при заданном значении Х0 имеет следующий вид:
от до .
Дата добавления: 2022-01-22; просмотров: 19; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!