Построим точечный прогноз в соответствии с данными задачи.
Задание по ОТСвыполнила Нижник Н.С. (СКрм 2.1.)
Парная линейная регрессия
ПРИМЕР 1
Постановка задачи
Из наблюдения за изменением диаметра ствола некоторого дерева имеются следующие данные:
| Диаметр дерева, измеренный на уровне груди | Высота дерева в футах |
| 5,50 | 58,00 |
| 5,70 | 60,00 |
| 5,80 | 42,00 |
| 6,50 | 64,00 |
| 6,60 | 60,00 |
| 6,70 | 65,00 |
| 6,90 | 56,00 |
| 7,00 | 57,00 |
| 7,30 | 70,00 |
| 8,30 | 68,00 |
| 8,60 | 65,00 |
| 9,50 | 70,00 |
| 10,00 | 63,00 |
| 10,10 | 75,00 |
| 10,20 | 72,00 |
| 10,40 | 78,00 |
| 10,60 | 65,00 |
| 10,60 | 80,00 |
| 10,80 | 82,00 |
| 11,30 | 70,00 |
| 11,30 | 74,00 |
| 11,60 | 68,00 |
| 11,60 | 68,00 |
| 13,00 | 82,00 |
| 18,00 | 88,00 |
Проверим адекватность модели линейной регрессии.
Построение графика
Представим исходные данные задачи в виде точечной диаграммы. Подпишем оси координат.Независимой переменной (высота дерева) соответствует горизонтальная осьX, зависимой (диаметр ствола) – вертикальнаяY.

Расчет линейного коэффициента парной корреляции.
По расположению точек предположим наличие линейной зависимости y= ax + b.
Вычислим параметры а и b уравнения парной линейной регрессии y = ax + b
Для расчета параметров уравнения линейной регрессии составляем расчетную
таблицу. Сначала заполняем столбцы с (1) по (6).
|
| X | Y | Y*X | X2 | Y2 |
| 1 | 5,50 | 58,00 | 319,00 | 30,25 | 3364,00 |
| 2 | 5,70 | 60,00 | 342,00 | 32,49 | 3600,00 |
| 3 | 5,80 | 42,00 | 243,60 | 33,64 | 1764,00 |
| 4 | 6,50 | 64,00 | 416,00 | 42,25 | 4096,00 |
| 5 | 6,60 | 60,00 | 396,00 | 43,56 | 3600,00 |
| 6 | 6,70 | 65,00 | 435,50 | 44,89 | 4225,00 |
| 7 | 6,90 | 56,00 | 386,40 | 47,61 | 3136,00 |
| 8 | 7,00 | 57,00 | 399,00 | 49,00 | 3249,00 |
| 9 | 7,30 | 70,00 | 511,00 | 53,29 | 4900,00 |
| 10 | 8,30 | 68,00 | 564,40 | 68,89 | 4624,00 |
| 11 | 8,60 | 65,00 | 559,00 | 73,96 | 4225,00 |
| 12 | 9,50 | 70,00 | 665,00 | 90,25 | 4900,00 |
| 13 | 10,00 | 63,00 | 630,00 | 100,00 | 3969,00 |
| 14 | 10,10 | 75,00 | 757,50 | 102,01 | 5625,00 |
| 15 | 10,20 | 72,00 | 734,40 | 104,04 | 5184,00 |
| 16 | 10,40 | 78,00 | 811,20 | 108,16 | 6084,00 |
| 17 | 10,60 | 65,00 | 689,00 | 112,36 | 4225,00 |
| 18 | 10,60 | 80,00 | 848,00 | 112,36 | 6400,00 |
| 19 | 10,80 | 82,00 | 885,60 | 116,64 | 6724,00 |
| 20 | 11,30 | 70,00 | 791,00 | 127,69 | 4900,00 |
| 21 | 11,30 | 74,00 | 836,20 | 127,69 | 5476,00 |
| 22 | 11,60 | 68,00 | 788,80 | 134,56 | 4624,00 |
| 23 | 11,60 | 68,00 | 788,80 | 134,56 | 4624,00 |
| 24 | 13,00 | 82,00 | 1066,00 | 169,00 | 6724,00 |
| 25 | 18,00 | 88,00 | 1584,00 | 324,00 | 7744,00 |
| Σ (сумма) | 233,9 | 1700 | 16447,4 | 2383,15 | 117986 |
| среднее | 9,356 | 68 | 657,896 | 95,326 | 4719,44 |
| σ2 | 7,79 | 95,44 |
|
|
|
| σ | 2,79 | 9,77 |
|
|
|
a = (y*x)cp. – ycp. * xcp. b = ycp. – a * xcp
σ2
Получено уравнение регрессии: y = 2.78x + 41.96
Смысл коэффициента регрессии: с увеличением высоты ствола на 1 футдиаметр этого ствола возрастает в среднем на 2.78ед.
Уравнение парной линейной регрессии всегда дополняется определением коэффициента линейной корреляции:

Вывод:Для данного примера – Rxy= 0,8, что указывает на достаточно тесную связь между высотой дерева и диаметром его ствола.
Построим линейное уравнение парной регрессии по исходным данным с использованием линии тренда.
Линии тренда позволяют наглядно показать тенденции изменения данных и помогают анализировать задачи прогноза.
Вычислим коэффициент детерминации: R2xy = 0,64. На графике он указан зеленым кружком.
Вывод: Это означает, что 64% роста диаметра дерева объясняется ростом дерева в высоту.
5.Проверим статистическую значимость уравнения регрессии с помощью F- критерия Фишера
, где
.
1) Выдвигаем гипотезу H0 о статистической незначимости уравнения регрессии
и коэффициента детерминации.Нулевая гипотеза (Н0) состоит в том, что коэффициент регрессии a равен нулю, т.е. факторный признак не оказывает влияния на результат.
2) Фактическое значение F-критерия равно: Fфакт. = 2911,40
3) Fкрит. = 4.28на уровне значимостиa=0,05 ичисле степеней свободы1 и
N - 2 =25- 2=23 .
Вывод: Fфакт. = 2911,40>FТАБЛ. = 5,32, ЗНАЧИТ,нулевая гипотеза отклоняется, уравнение регрессии на уровне значимости 0,05 признается статистически значимым, а воздействие признака х на у – существенным.
Оценим значимость параметров уравнения регрессии с помощью статистики Стьюдента.
Обозначим стандартные ошибки a,bи коэффициента корреляции
соответственноma, mbиmr. Они вычисляются по формулам:
.
Оценку статистической значимости параметровa,b уравнения регрессии и коэффициента корреляции
проводят с помощью t-статистики Стьюдента и построения доверительных интервалов для каждого из показателей.
1)Выдвигаем гипотезу H0. Нулевая гипотеза (Н0) заключается в том, что показатели a, b и
незначительно отличаются от нуля, т.е. можно считать a=b=
=0.
Фактические значения t-статистики Стьюдента определяются по формулам:

2)Находим все необходимые нам значения, для удобства сделаем это в табличной форме:
| a | b | r | |||
| Стандартные ошибки(ma/mb/mr) | 5,56868E-05 | 2,98726E-05 | 0,986152858 | ||
| t-статистика(факт.) (t0.tb,tr) | 49987,2 | 1404507,7 | 6,29 | ||
| t-статистика(крит..) | 2,07 | 2,07 | 2,07 | ||
| Нижняя граница доверительного интервала | 2,7837 | 41,9565 | |||
| Верхняя граница доверительного интервала | 2,7835 | 41,9562 | |||
Как и в случае критерия Фишера, фактические значения t-статистики Стьюдента сравниваются с критическими – – для некоторого уровня значимости a и соответствующего числа степеней свободы (в данном примере df = n-2= 23). В случае, когда фактические значения превосходят критические, гипотеза Н0 отклоняется, то есть a, b и R2xy являются статистически значимыми (на данном уровне a).
Вывод:Данные таблицыпоказывают, что фактические значения t-статистики превосходят критические, следовательно, нулевая гипотеза (о незначительном отличии параметров регрессии от нуля) отклоняется, параметры уравнения являются статистически значимыми (на уровне a=0,05).
7.Построим доверительные интервалы для a –
, где
, и для b –
, где
.
Вывод:С вероятностью
параметры aи b, находясь в указанных границах, не принимают нулевых значений, т.е. не являются статистически незначимыми и существенно отличны от нуля.
Построим точечный прогноз в соответствии с данными задачи.
Полученное уравнение регрессии позволяет построить точечные прогноз параметра y для некоторого xпрпутем подстановки этого значения в уравнение регрессии:
yпр = axпр + b
По условию задачи Xпр = 12, следовательно, значение точечного прогноза: Yпр = 75,3.
Однако на практике также используется доверительный интервал прогноза.
Дата добавления: 2018-02-15; просмотров: 437; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!
