Построим точечный прогноз в соответствии с данными задачи.
Задание по ОТСвыполнила Нижник Н.С. (СКрм 2.1.)
Парная линейная регрессия
ПРИМЕР 1
Постановка задачи
Из наблюдения за изменением диаметра ствола некоторого дерева имеются следующие данные:
Диаметр дерева, измеренный на уровне груди | Высота дерева в футах |
5,50 | 58,00 |
5,70 | 60,00 |
5,80 | 42,00 |
6,50 | 64,00 |
6,60 | 60,00 |
6,70 | 65,00 |
6,90 | 56,00 |
7,00 | 57,00 |
7,30 | 70,00 |
8,30 | 68,00 |
8,60 | 65,00 |
9,50 | 70,00 |
10,00 | 63,00 |
10,10 | 75,00 |
10,20 | 72,00 |
10,40 | 78,00 |
10,60 | 65,00 |
10,60 | 80,00 |
10,80 | 82,00 |
11,30 | 70,00 |
11,30 | 74,00 |
11,60 | 68,00 |
11,60 | 68,00 |
13,00 | 82,00 |
18,00 | 88,00 |
Проверим адекватность модели линейной регрессии.
Построение графика
Представим исходные данные задачи в виде точечной диаграммы. Подпишем оси координат.Независимой переменной (высота дерева) соответствует горизонтальная осьX, зависимой (диаметр ствола) – вертикальнаяY.
Расчет линейного коэффициента парной корреляции.
По расположению точек предположим наличие линейной зависимости y= ax + b.
Вычислим параметры а и b уравнения парной линейной регрессии y = ax + b
Для расчета параметров уравнения линейной регрессии составляем расчетную
таблицу. Сначала заполняем столбцы с (1) по (6).
| X | Y | Y*X | X2 | Y2 | ||
1 | 5,50 | 58,00 | 319,00 | 30,25 | 3364,00 | ||
2 | 5,70 | 60,00 | 342,00 | 32,49 | 3600,00 | ||
3 | 5,80 | 42,00 | 243,60 | 33,64 | 1764,00 | ||
4 | 6,50 | 64,00 | 416,00 | 42,25 | 4096,00 | ||
5 | 6,60 | 60,00
| 396,00 | 43,56 | 3600,00 | ||
6 | 6,70 | 65,00 | 435,50 | 44,89 | 4225,00 | ||
7 | 6,90 | 56,00 | 386,40 | 47,61 | 3136,00 | ||
8 | 7,00 | 57,00 | 399,00 | 49,00 | 3249,00 | ||
9 | 7,30 | 70,00 | 511,00 | 53,29 | 4900,00 | ||
10 | 8,30 | 68,00 | 564,40 | 68,89 | 4624,00 | ||
11 | 8,60 | 65,00 | 559,00 | 73,96 | 4225,00 | ||
12 | 9,50 | 70,00 | 665,00 | 90,25 | 4900,00 | ||
13 | 10,00 | 63,00 | 630,00 | 100,00 | 3969,00 | ||
14 | 10,10 | 75,00 | 757,50 | 102,01 | 5625,00 | ||
15 | 10,20 | 72,00 | 734,40 | 104,04 | 5184,00 | ||
16 | 10,40 | 78,00 | 811,20 | 108,16 | 6084,00 | ||
17 | 10,60 | 65,00 | 689,00 | 112,36 | 4225,00 | ||
18 | 10,60 | 80,00 | 848,00 | 112,36 | 6400,00 | ||
19 | 10,80 | 82,00 | 885,60 | 116,64 | 6724,00 | ||
20 | 11,30 | 70,00 | 791,00 | 127,69 | 4900,00 | ||
21 | 11,30 | 74,00 | 836,20 | 127,69 | 5476,00 | ||
22 | 11,60 | 68,00 | 788,80 | 134,56 | 4624,00 | ||
23 | 11,60 | 68,00 | 788,80 | 134,56 | 4624,00 | ||
24 | 13,00 | 82,00 | 1066,00 | 169,00 | 6724,00 | ||
25 | 18,00 | 88,00 | 1584,00 | 324,00 | 7744,00 | ||
Σ (сумма) | 233,9 | 1700 | 16447,4 | 2383,15 | 117986 | ||
среднее | 9,356 | 68 | 657,896 | 95,326 | 4719,44 | ||
σ2 | 7,79 | 95,44 |
|
|
| ||
σ | 2,79 | 9,77 |
|
|
|
a = (y*x)cp. – ycp. * xcp. b = ycp. – a * xcp
σ2
Получено уравнение регрессии: y = 2.78x + 41.96
Смысл коэффициента регрессии: с увеличением высоты ствола на 1 футдиаметр этого ствола возрастает в среднем на 2.78ед.
Уравнение парной линейной регрессии всегда дополняется определением коэффициента линейной корреляции:
Вывод:Для данного примера – Rxy= 0,8, что указывает на достаточно тесную связь между высотой дерева и диаметром его ствола.
|
|
Построим линейное уравнение парной регрессии по исходным данным с использованием линии тренда.
Линии тренда позволяют наглядно показать тенденции изменения данных и помогают анализировать задачи прогноза.
Вычислим коэффициент детерминации: R2xy = 0,64. На графике он указан зеленым кружком.
Вывод: Это означает, что 64% роста диаметра дерева объясняется ростом дерева в высоту.
5.Проверим статистическую значимость уравнения регрессии с помощью F- критерия Фишера , где .
1) Выдвигаем гипотезу H0 о статистической незначимости уравнения регрессии
и коэффициента детерминации.Нулевая гипотеза (Н0) состоит в том, что коэффициент регрессии a равен нулю, т.е. факторный признак не оказывает влияния на результат.
2) Фактическое значение F-критерия равно: Fфакт. = 2911,40
3) Fкрит. = 4.28на уровне значимостиa=0,05 ичисле степеней свободы1 и
N - 2 =25- 2=23 .
Вывод: Fфакт. = 2911,40>FТАБЛ. = 5,32, ЗНАЧИТ,нулевая гипотеза отклоняется, уравнение регрессии на уровне значимости 0,05 признается статистически значимым, а воздействие признака х на у – существенным.
|
|
Оценим значимость параметров уравнения регрессии с помощью статистики Стьюдента.
Обозначим стандартные ошибки a,bи коэффициента корреляции соответственноma, mbиmr. Они вычисляются по формулам:
.
Оценку статистической значимости параметровa,b уравнения регрессии и коэффициента корреляции проводят с помощью t-статистики Стьюдента и построения доверительных интервалов для каждого из показателей.
1)Выдвигаем гипотезу H0. Нулевая гипотеза (Н0) заключается в том, что показатели a, b и незначительно отличаются от нуля, т.е. можно считать a=b= =0.
Фактические значения t-статистики Стьюдента определяются по формулам:
2)Находим все необходимые нам значения, для удобства сделаем это в табличной форме:
a | b | r | |||
Стандартные ошибки(ma/mb/mr) | 5,56868E-05 | 2,98726E-05 | 0,986152858 | ||
t-статистика(факт.) (t0.tb,tr) | 49987,2 | 1404507,7 | 6,29 | ||
t-статистика(крит..) | 2,07 | 2,07 | 2,07 | ||
Нижняя граница доверительного интервала | 2,7837 | 41,9565 | |||
Верхняя граница доверительного интервала | 2,7835 | 41,9562 |
Как и в случае критерия Фишера, фактические значения t-статистики Стьюдента сравниваются с критическими – – для некоторого уровня значимости a и соответствующего числа степеней свободы (в данном примере df = n-2= 23). В случае, когда фактические значения превосходят критические, гипотеза Н0 отклоняется, то есть a, b и R2xy являются статистически значимыми (на данном уровне a).
|
|
Вывод:Данные таблицыпоказывают, что фактические значения t-статистики превосходят критические, следовательно, нулевая гипотеза (о незначительном отличии параметров регрессии от нуля) отклоняется, параметры уравнения являются статистически значимыми (на уровне a=0,05).
7.Построим доверительные интервалы для a – , где , и для b – , где .
Вывод:С вероятностью параметры aи b, находясь в указанных границах, не принимают нулевых значений, т.е. не являются статистически незначимыми и существенно отличны от нуля.
Построим точечный прогноз в соответствии с данными задачи.
Полученное уравнение регрессии позволяет построить точечные прогноз параметра y для некоторого xпрпутем подстановки этого значения в уравнение регрессии:
yпр = axпр + b
По условию задачи Xпр = 12, следовательно, значение точечного прогноза: Yпр = 75,3.
Однако на практике также используется доверительный интервал прогноза.
Дата добавления: 2018-02-15; просмотров: 416; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!