Построим точечный прогноз в соответствии с данными задачи.

Задание по ОТСвыполнила Нижник Н.С. (СКрм 2.1.)

Парная линейная регрессия

ПРИМЕР 1

Постановка задачи

Из наблюдения за изменением диаметра ствола некоторого дерева имеются следующие данные:

Диаметр дерева, измеренный на уровне груди

Высота дерева в футах

5,50

58,00

5,70

60,00

5,80

42,00

6,50

64,00

6,60

60,00

6,70

65,00

6,90

56,00

7,00

57,00

7,30

70,00

8,30

68,00

8,60

65,00

9,50

70,00

10,00

63,00

10,10

75,00

10,20

72,00

10,40

78,00

10,60

65,00

10,60

80,00

10,80

82,00

11,30

70,00

11,30

74,00

11,60

68,00

11,60

68,00

13,00

82,00

18,00

88,00

 

Проверим адекватность модели линейной регрессии.

 

Построение графика

Представим исходные данные задачи в виде точечной диаграммы. Подпишем оси координат.Независимой переменной (высота дерева) соответствует горизонтальная осьX, зависимой (диаметр ствола) – вертикальнаяY.

Расчет линейного коэффициента парной корреляции.

По расположению точек предположим наличие линейной зависимости y= ax + b.

Вычислим параметры а и b уравнения парной линейной регрессии  y = ax + b

Для расчета параметров уравнения линейной регрессии составляем расчетную

таблицу. Сначала заполняем столбцы с (1) по (6).

 

X

Y

Y*X

X2

Y2

1

5,50

58,00

319,00

30,25

3364,00

2

5,70

60,00

342,00

32,49

3600,00

3

5,80

42,00

243,60

33,64

1764,00

4

6,50

64,00

416,00

42,25

4096,00

5

6,60

60,00

396,00

43,56

3600,00

6

6,70

65,00

435,50

44,89

4225,00

7

6,90

56,00

386,40

47,61

3136,00

8

7,00

57,00

399,00

49,00

3249,00

9

7,30

70,00

511,00

53,29

4900,00

10

8,30

68,00

564,40

68,89

4624,00

11

8,60

65,00

559,00

73,96

4225,00

12

9,50

70,00

665,00

90,25

4900,00

13

10,00

63,00

630,00

100,00

3969,00

14

10,10

75,00

757,50

102,01

5625,00

15

10,20

72,00

734,40

104,04

5184,00

16

10,40

78,00

811,20

108,16

6084,00

17

10,60

65,00

689,00

112,36

4225,00

18

10,60

80,00

848,00

112,36

6400,00

19

10,80

82,00

885,60

116,64

6724,00

20

11,30

70,00

791,00

127,69

4900,00

21

11,30

74,00

836,20

127,69

5476,00

22

11,60

68,00

788,80

134,56

4624,00

23

11,60

68,00

788,80

134,56

4624,00

24

13,00

82,00

1066,00

169,00

6724,00

25

18,00

88,00

1584,00

324,00

7744,00

Σ (сумма)

233,9

1700

16447,4

2383,15

117986

среднее

9,356

68

657,896

95,326

4719,44

σ2

7,79

95,44

 

 

 

σ

2,79

9,77

 

 

 

 

a = (y*x)cp. – ycp. * xcp.        b = ycp. – a * xcp

σ2

Получено уравнение регрессии: y = 2.78x + 41.96

Смысл коэффициента регрессии: с увеличением высоты ствола на 1 футдиаметр этого ствола возрастает в среднем на 2.78ед.

Уравнение парной линейной регрессии всегда дополняется определением коэффициента линейной корреляции:

 

Вывод:Для данного примера – Rxy= 0,8, что указывает на достаточно тесную связь между высотой дерева и диаметром его ствола.

 

Построим линейное уравнение парной регрессии по исходным данным с использованием линии тренда.

Линии тренда позволяют наглядно показать тенденции изменения данных и помогают анализировать задачи прогноза.

Вычислим коэффициент детерминации: R2xy = 0,64. На графике он указан зеленым кружком.

Вывод: Это означает, что 64% роста диаметра дерева объясняется ростом дерева в высоту.

 

 

5.Проверим статистическую значимость уравнения регрессии с помощью F- критерия Фишера   , где          .

1) Выдвигаем гипотезу H0 о статистической незначимости уравнения регрессии

и коэффициента детерминации.Нулевая гипотеза (Н0) состоит в том, что коэффициент регрессии a равен нулю, т.е. факторный признак не оказывает влияния на результат.

2) Фактическое значение F-критерия равно: Fфакт. = 2911,40

3) Fкрит. = 4.28на уровне значимостиa=0,05 ичисле степеней свободы1 и

N  - 2 =25- 2=23 .

 

Вывод: Fфакт. = 2911,40>FТАБЛ. = 5,32, ЗНАЧИТ,нулевая гипотеза отклоняется, уравнение регрессии на уровне значимости 0,05 признается статистически значимым, а воздействие признака х на у – существенным.

 

Оценим значимость параметров уравнения регрессии с помощью статистики Стьюдента.

Обозначим стандартные ошибки a,bи коэффициента корреляции  соответственноma, mbиmr. Они вычисляются по формулам:

.

Оценку статистической значимости параметровa,b уравнения регрессии и коэффициента корреляции  проводят с помощью t-статистики Стьюдента и построения доверительных интервалов для каждого из показателей.

1)Выдвигаем гипотезу H0. Нулевая гипотеза (Н0) заключается в том, что показатели a, b и  незначительно отличаются от нуля, т.е. можно считать a=b= =0.

Фактические значения t-статистики Стьюдента определяются по формулам:        

 

2)Находим все необходимые нам значения, для удобства сделаем это в табличной форме:

a

b

r

Стандартные ошибки(ma/mb/mr)

5,56868E-05

2,98726E-05

0,986152858

t-статистика(факт.) (t0.tb,tr)

49987,2

1404507,7

6,29

t-статистика(крит..)

2,07

2,07

2,07

Нижняя граница доверительного интервала

2,7837

41,9565

Верхняя граница доверительного интервала

2,7835

41,9562

 

Как и в случае критерия Фишера, фактические значения t-статистики Стьюдента сравниваются с критическими – – для некоторого уровня значимости a и соответствующего числа степеней свободы (в данном примере df = n-2= 23). В случае, когда фактические значения превосходят критические, гипотеза Н0 отклоняется, то есть a, b и R2xy   являются статистически значимыми (на данном уровне a).

Вывод:Данные таблицыпоказывают, что фактические значения t-статистики превосходят критические, следовательно, нулевая гипотеза (о незначительном отличии параметров регрессии от нуля) отклоняется, параметры уравнения являются статистически значимыми (на уровне a=0,05).

 

7.Построим доверительные интервалы для a – , где , и для b – , где .

Вывод:С вероятностью  параметры aи b, находясь в указанных границах, не принимают нулевых значений, т.е. не являются статистически незначимыми и существенно отличны от нуля.

 

 

Построим точечный прогноз в соответствии с данными задачи.

Полученное уравнение регрессии позволяет построить точечные прогноз параметра y для некоторого xпрпутем подстановки этого значения в уравнение регрессии:

yпр = axпр + b

По условию задачи Xпр = 12, следовательно, значение точечного прогноза: Yпр = 75,3.

Однако на практике также используется доверительный интервал прогноза.

 


Дата добавления: 2018-02-15; просмотров: 416; Мы поможем в написании вашей работы!

Поделиться с друзьями:




Мы поможем в написании ваших работ!