Статистико-математические таблицы



Таблица значений F -критерия Фишера при уровне значимости

k2=n-m

k1=m-1

1 2 3 4 5 6 8 12 24

1 161,45 199,5 215,72 224,57 230,17 233,97 238,89 243,91 249,04

254,32

2 18,51 19,00 19,16 19,25 19,30 19,33 19,37 19,41 19,45

19,50

3 10,13 9,55 9,28 9,12 9,01 8,94 8,84 8,74 8,64

8,53

4 7,71 6,94 6,59 6,39 6,26 6,16 6,04 5,91 5,77

5,63

5 6,61 5,79 5,41 5,19 5,05 4,95 4,82 4,68 4,53

4,36

6 5,99 5,14 4,76 4,53 4,39 4,28 4,15 4,00 3,84

3,67

7 5,59 4,74 4,35 4,12 3,97 3,87 3,73 3,57 3,41

3,23

8 5,32 4,46 4,07 3,84 3,69 3,58 3,44 3,28 3,12

2,93

9 5,12 4,26 3,86 3,63 3,48 3,37 3,23 3,07 2,90

2,71

10 4,96 4,10 3,71 3,48 3,33 3,22 307 2,91 2,74

2,54

11 4,84 3,98 3,59 3,36 3,20 3,09 2,95 2,79 2,61

2,40

12 4,75 3,88 3,49 3,26 3,11 3,00 2,85 2,69 2,50

2,30

13 4,67 3,80 3,41 3,18 3,02 2,92 2,77 2,60 2,42

2,21

14 4,60 3,74 3,34 3,11 2,96 2,85 2,70 2,53 2,35

2,13

15 4,54 3,68 3,29 3,06 2,90 2,79 2,64 2,48 2,29

2,07

16 4,49 3,63 3,24 3,01 2,85 2,74 2,59 2,42 2,24

2,01

17 4,45 3,59 3,20 2,96 2,81 2,70 2,55 2,38 2,19

1,96

18 4,41 3,55 3,16 2,93 2,77 2,66 2,51 2,34 2,15

1,92

19 4,38 3,52 3,13 2,90 2,74 2,63 2,48 2,31 2,11

1,88

20 4,35 3,49 3,10 2,87 2,71 2,60 2,45 2,28 2,08

1,84

21 4,32 3,47 3,07 2,84 2,68 2,57 2,42 2,25 2,05

1,81

22 4,30 3,44 3,05 2,82 2,66 2,55 2,40 2,23 2,03

1,78

23 4,28 3,42 3,03 2,80 2,64 2,53 2,38 2,20 2,00

1,76

24 4,26 3,40 3,01 2,78 2,62 2,51 2,36 2,18 1,98

1,73

25 4,24 3,38 2,99 2,76 2,60 2,49 2,34 2,16 1,96

1,71

26 4,22 3,37 2,98 2,74 2,59 2,47 2,32 2,15 1,95

1,69

27 4,21 3,35 2,96 2,73 2,57 2,46 2,30 2,13 1,93

1,67

28 4,20 3,34 2,95 2,71 2,56 2,44 2,29 2,12 1,91

1,65

29 4,18 3,33 2,93 2,70 2,54 2,43 2,28 2,10 1,90

1,64

30 4,17 3,32 2,92 2,69 2,53 2,42 2,27 2,09 1,89

1,62

35 4,12 3,26 2,87 2,64 2,48 2,37 2,22 2,04 1,83

1,57

40 4,08 3,23 2,84 2,61 2,45 2,34 2,18 2,00 1,79

1,51

45 4,06 3,21 2,81 2,58 2,42 2,31 2,15 1,97 1,76

1,48

50 4,03 3,18 2,79 2,56 2,40 2,29 2,13 1,95 1,74

1,44

60 4,00 3,15 2,76 2,52 2,37 2,25 2,10 1,92 1,70 1,39  
70 3,89 3,13 2,74 2,50 2,35 2,23 2,07 1,89 1,67 1,35  
80 3,96 3,11 2,72 2,49 2,33 2,21 2,06 1,88 1,65 1,31  
90 3,95 310 2,71 2,47 2,32 2,20 2,04 1,86 1,64 1,28  
100 3,94 3,09 2,70 2,46 2,30 2,19 2,03 1,85 1,63 1,26  
125 3,92 3,07 2,68 2,44 2,29 2,17 2,01 1,83 1,60 1,21  
150 3,90 3,06 2,66 2,43 2,27 2,16 2,00 1,82 1,59 1,18  
200 3,89 3,04 2,65 2,42 2,26 2,14 1,98 1,80 1,57 1,14  
300 3,87 3,03 2,64 2,41 2,25 2,13 1,97 1,79 1,55 1,10  
400 3,86 3,02 2,63 2,40 2,24 2,12 1,96 1,78 1,54 1,07  
500 3,86 3,01 2,62 2,39 2,23 2,11 1,96 1,77 1,54 1,06  
1000 3,85 3,00 2,61 2,38 2,22 2,10 1,95 1,76 1,53 1,03  
3,84 2,99 2,60 2,37 2,21 2,09 1,94 1,75 1,52 1,00  

Приложение 3

Критические значения t –критерия Стьюдента при уровне значимости 0,10; 0,05; 0,01 (двухсторонний)

 

Число степеней свободы

Число степеней свободы

0,10 0,05 0,01 0,10 0,05 0,01
1 6,3138 12,706 63,657 18 1,7341 2,1009 2,8784
2 2,9200 4,3027 9,9248 19 1,7291 2,0930 2,8609
3 2,3534 3,1825 5,8409 20 1,7247 2,0860 2,8453
4 2,1318 2,7764 4,6041 21 1,7207 2,0796 2,8314
5 2,0150 2,5706 4,0321 22 1,7171 2,0739 2,8188
6 1,9432 2,4469 3,7074 23 1,7139 2,0687 2,8073
7 1,8946 2,3646 3,495 24 1,7109 2,0639 2,7969
8 1,8595 2,3060 3,3554 25 1,7081 2,0595 2,7874
9 1,8331 2,2622 3,2498 26 1,7056 2,0555 2,7787
10 1,8125 2,2281 3,1693 27 1,7033 2,0518 2,7707
11 1,7959 2,2010 3,1058 28 1,7011 2,0484 2,7633
12 1,7823 2,1788 3,0545 29 1,6991 2,0452 2,7564
13 1,7709 2,1604 3,0123 30 1,6973 2,0423 2,7500
14 1,7613 2,1448 2,9768 40 1,6839 2,0211 2,7045
15 1,7530 2,1315 2,9467 60 1,6707 2,0003 2,6603
16 1,7459 2,1199 2,9208 120 1,6577 1,9799 2,6174
17 1,7396 2,1098 2,8982 1,6449 1,9600 2,5758

 

 


Приложение 2

Решение типовых заданий.

Тема 1. Парная линейная регрессия.

1. Рассчитайте оценки параметров парной линейной регрессии, где у – расходы на покупку продовольственных товаров, % к общему объему расходов, а х – среднемесячная заработная плата 1 работника, тыс. руб.

Параметры а и b линейной регрессии  рассчитываются в результате решения системы нормальных уравнений относительно а и b:

По исходным данным рассчитаем .

Система нормальных уравнений составит:

Решаем ее методом определителей: определитель системы ∆ равен:

,

,

,

Получаем уравнение регрессии: .

Этот же результат можно получить, используя следующие формулы для нахождения параметров:

, ,

где  - дисперсия по факторному признаку.


 

Таблица 1. – Расчетные данные

Номер региона х у ху у-
1 4,5 68,8 309,6 20,25 4733,44 67,1 1,7 2,97 121,629 86,583 2,84 2,47
2 5,9 58,3 343,97 34,81 3398,89 59,3 -1,0 1,10 0,279 2,487 0,08 1,72
3 5,7 62,6 356,82 32,49 3918,76 60,4 2,2 4,61 23,315 7,189 0,24 0,51
4 7,2 52,1 375,12 51,84 2714,41 52,2 -0,1 0,01 32,165 31,346 1,03 0,19
5 6,2 54,5 337,9 38,44 2970,25 57,7 -3,2 10,19 10,702 0,006 0,00 5,87
6 6 57,1 342,6 36 3260,41 58,8 -1,7 2,88 0,451 1,051 0,03 2,98
7 7,8 51 397,8 60,84 2601,00 48,9 2,1 4,58 45,852 79,399 2,61 4,12
Сумма 43,3 404,4 2463,81 274,67 23597,16 404,4 0 26,33 234,39 208,06 6,83 20,86
Среднее значение 6,186 57,77 351,97 39,24 3371,02 - - - - - - -

 

 


Однако, оперируя средними величинами, мы можем столкнуться с ошибками округления. Действительно, . Соответственно не совпадает и величина параметра , т.е.

При решении с помощью компьютера уравнение регрессии составило: .

Величина коэффициента регрессии означает, что с ростом заработной платы на 1 тыс. руб. доля расходов на покупку продовольственных товаров снижается в среднем на 5.5 % - х пункта.

1. Оцените тесноту связи между признаками.

Линейное уравнение регрессии дополняется расчетом линейного коэффициента корреляции:

 или .

Так как  то , что означает тесную обратную связь рассматриваемых признаков.

2. Рассчитайте коэффициент детерминации.

Коэффициент детерминации составит: , т.е. вариация у на 88,8 % объясняется вариацией х. На долю прочих факторов, не учитываемых в регрессии, приходится 11,2 %.

3. Проверьте значимость оценки коэффициента регрессии с помощью критерия Стьюдента при уровне значимости α=0,05.

Оценку статистической значимости коэффициента регрессии проведем с помощью t - критерия Стьюдента.

Выдвигаем две гипотезы:

Н0 – коэффициент регрессии является статистически незначимым, т.е. b=0;

Н1 – коэффициент регрессии статистически значим, т.е. b≠0.

Определим стандартную ошибку для коэффициента регрессии mb:

.

Далее вычисляем значения t – критерия Стьюдента:

.

Фактическое значение t – критерии превосходит табличное значение на 5 %-м уровне значимости при числе степеней свободы =5: tтабл = 2,57. Поэтому гипотеза Н0 отклоняется, т.е. b отличается от нуля не случайно и коэффициент регрессии является статистически значимым.

4. Постройте доверительный интервал для коэффициента регрессии.

Рассчитаем доверительный интервал для коэффициента регрессии, для чего определим предельную ошибку для параметра b.

.

Доверительные интервалы: , т.е.

Анализ верхней и нижней границ доверительного интервала приводит к выводу о том, что с вероятностью 95% коэффициент регрессии, находясь в указанных границах, не принимает нулевых значение, т.е. не является статистически незначимым и существенно отличен от нуля.

5. Составить таблицу дисперсионного анализа.

Результаты дисперсионного анализа приведены в таблице 2.

 

Таблица 2. – Таблица дисперсионного анализа

Вариация результата

Число степеней свободы

Сумма квадратов отклонений

Дисперсия на одну степень свободы

F - критерий

факт.

табл.

Общая

6

234,39

 

 

 

Факторная

1

208,06

208,06

39,5

6,61

Остаточная

5

26,33

5,27

 

 

 

6. Оцените с помощью F – критерия Фишера-Снедекора значимость уравнения линейной регрессии.

В силу того, что Fфакт=39,5> Fтабл=6,61, гипотеза о случайности различий факторной и остаточной дисперсий отклоняется. Эти различия существенны, статистически значимы, уравнение значимо, показатель тесноты связи надежен и отражает устойчивую зависимость расходов на покупку продовольственных товаров от среднемесячной заработной платы.

8. Рассчитайте, каковы будут расходы на покупку продовольственных товаров, если среднемесячная заработная плата составит 8 тыс. руб.

Полученные оценки уравнения регрессии позволяют использовать его для прогноза. Если примем прогнозное значение среднемесячной заработной платы х=8, то точечный прогноз расходов составит:  % - х пункта.

Чтобы получить интервальный прогноз, найдем стандартную ошибку предсказываемого значения расходов .

;

где  - стандартная ошибка регрессии.

Предельная ошибка прогнозируемого расхода составит:

.

Доверительный интервал прогнозируемого расхода составит:

,

т.е. при среднемесячной заработной плате, равной 8 тыс. руб., расходы на покупку продовольственных товаров составят не меньше чем

 % - х пункта

и не больше чем

 % - х пункта.

9. Рассчитайте средний коэффициент эластичности.

Средний коэффициент эластичности для линейной регрессии рассчитывается по формуле:

.

Таким образом, получаем, что с ростом среднемесячной заработной платы на 1 % расходы на покупку продовольственных товаров снижаются на 4,14 %.

10. Определить среднюю ошибку аппроксимации.

Средняя ошибка аппроксимации находится как средняя арифметическая простая из индивидуальных ошибок:

,

(см. последнюю графу расчетной таблицы 1).

Ошибка аппроксимации показывает хорошее соответствие расчетных и фактических данных: среднее отклонение составляет 2,98 %.

 

Тема 2. Нелинейная регрессия

 

1. Рассчитать параметры следующих функций:

- степенной;

- равносторонней гиперболы;

- показательной.

2. Найти показатели тесноты связи по каждой модели.

3. Оценить каждую модель через показатель детерминации, F – критерий Фишера, ошибку аппроксимации и выбрать наилучшую из них.

 

Регрессия в виде степенной функции имеет вид: .

Для оценки параметров модели линеаризуем модель путем логарифмирования:

.

Обозначим . Тогда получим: . Для расчетов составим таблицу 3.

 

Таблица 3.

Номер региона X Y ХY
1 1,504 4,231 6,364 2,262 17,901 4,228 68,6 0,04 0,29
2 1,775 4,066 7,217 3,151 16,532 4,071 58,6 0,09 0,51
3 1,740 4,137 7,198 3,029 17,115 4,092 59,9 7,29 4,31
4 1,974 3,953 7,803 3,897 15,626 3,957 52,3 0,04 0,38
5 1,825 3,948 7,296 3,329 15,984 4,042 56,9 5,76 4,40
6 1,792 4,045 7,249 3,211 16,362 4,062 58,1 1,00 1,75
7 2,054 3,932 8,076 4,219 15,461 3,910 49,9 1,21 2,16
Сумма 12,664 28,362 51,203 23,098 114,98 28,362 404,3 15,43 13,80
Среднее значение 1,809 4,052 7,315 3,300 16,426 - - - -

 

Запишем систему нормальных уравнений:

.

Отсюда , ; ,

Получаем уравнение регрессии: .

Выполнив потенцирование, получим:

.

Параметр означает коэффициент эластичности, который показывает, что с ростом зарплаты на 1 % доля расходов на продовольствие снижается на 0,58 %.

Теоретические значения зависимой переменной  получим, подставив в уравнение  значения х и потенцируя значения . В таблице 3. представлены  и .

Показателем тесноты связи выступает индекс корреляции:

.

Величина представлена в таблице 3: .

.

В результате имеем:

.

Коэффициент детерминации равен: , т.е. 93,93 % вариации у объясняется вариацией х, на долю прочих факторов приходится 6,07 %.

F – критерий Фишера составит:

.

Эта величина превышает табличное значение на 5 %-м уровне значимости (Fтабл=6,61). Следовательно, найденное уравнение регрессии  статистически значимо.

Для расчета средней ошибки аппроксимации воспользуемся последней графой таблицы 3.

 т.е. среднее отклонение фактических и расчетных значений у составляет 2 %, что свидетельствует о хорошем качестве модели.

Регрессия в виде показательной функции имеет вид: .

Для оценки параметров модели линеаризуем модель путем логарифмирования:

.

Обозначим . Тогда получим: . Для расчетов составим таблицу 4.

 

Таблица 4.

Номер региона х Y xY y- (y- )2 (y- )2
1 4,5 4,23 19,04 20,25

4,21

67,35

1,45

2,11

121,63

2,111464

2 5,9 4,07 23,99 34,81

4,08

59,06

-0,76

0,57

0,28

1,296827

3 5,7 4,14 23,58 32,49

4,10

60,17

2,43

5,88

23,32

3,873993

4 7,2 3,95 28,46 51,84

3,96

52,27

-0,17

0,03

32,17

0,33356

5 6,2 4,00 24,79 38,44

4,05

57,42

-2,92

8,51

10,70

5,351722

6 6 4,04 24,27 36

4,07

58,50

-1,40

1,97

0,45

2,459651

7 7,8 3,93 30,67 60,84

3,90

49,41

1,59

2,52

45,85

3,113949

Сумма

43,3

28,36 174,80 274,67

28,36

404,19

0

21,60

234,39

18,54

Средняя

6,19

4,05 24,97 39,24

 

 

 

 

 

 

 

Запишем систему нормальных уравнений:

.

В результате:

Получаем уравнение регрессии: . Теперь потенцируем оба параметра, чтобы получить уравнение регрессии в форме показательной кривой:

.

Теоретические значения зависимой переменной  получим, подставив в уравнение  значения х и потенцируя значения . В таблице 4. представлены  и .

Показателем тесноты связи выступает индекс корреляции:

.

Величина представлена в таблице 4: .

.

В результате имеем:

.

Коэффициент детерминации равен: , т.е. 90,24 % вариации у объясняется вариацией х, на долю прочих факторов приходится 9,76 %.

F – критерий Фишера составит:

.

Эта величина превышает табличное значение на 5 %-м уровне значимости (Fтабл=6,61). Следовательно, найденное уравнение регрессии  статистически значимо.

Для расчета средней ошибки аппроксимации воспользуемся последней графой таблицы 4.

 т.е. соответствие фактических и расчетных значений зависимой переменной хорошее и соответственно хорошее качество модели.

 

Регрессия в виде равносторонней гиперболы имеет вид: .

Чтобы оценить параметры уравнения приведем модель к линейному виду, заменив . Тогда . Применяя МНК, получаем систему нормальных уравнений:

Для расчета параметров составим таблицу 5.

 

 

Таблица 5.

 

Номер региона у yz
1 68,8 0,222 15,289 0,049 69,9 -1,1 1,21 1,60
2 58,3 0,170 9,881 0,029 58,5 -0,2 0,04 0,34
3 62,6 0,175 10,983 0,031 59,8 2,8 7,84 4,47
4 52,1 0,139 7,236 0,019 51,9 0,1 0,01 0,19
5 54,5 0,161 8,790 0,026 56,7 -2,2 4,84 4,04
6 57,1 0,167 9,517 0,028 57,9 -0,8 0,64 1,40
7 51,0 0,128 6,538 0,016 49,6 1,4 1,96 2,75
Сумма 404,4 1,162 68,234 0,198 404,4 0 16,54 14,79

 

Запишем систему нормальных уравнений:

.

Отсюда , ; ,

Получаем уравнение регрессии: .

Показателем тесноты связи выступает индекс корреляции:

.

Величина представлена в таблице 5: .

.

В результате имеем:

.

Коэффициент детерминации равен: , т.е. 92,94 % вариации у объясняется вариацией х, на долю прочих факторов приходится 7,06 %.

F – критерий Фишера составит:

.

Эта величина превышает табличное значение на 5 %-м уровне значимости (Fтабл=6,61). Следовательно, найденное уравнение регрессии  статистически значимо.

Для расчета средней ошибки аппроксимации воспользуемся последней графой таблицы 5.

 т.е. среднее отклонение фактических и расчетных значений у составляет 2 %, что свидетельствует о хорошем качестве модели.

Выберем наилучшую модель, для чего объединим результаты построения парных регрессий в одну таблицу.

 

Таблица 6. - Сводная таблица построенных уравнений

Уравнение регрессии Коэффициент детерминации F – критерий Фишера Средняя ошибка аппроксимации, %
0,9393 77,4 1,97
0,9024 46,24 2,65
0,9294 65,8 2,11

 

Все уравнения регрессии достаточно хорошо описывают исходные данные. Некоторое предпочтение можно отдать степенной функции, для которой значение коэффициента детерминации наибольшее, а ошибка аппроксимации – наименьшая.

 


Дата добавления: 2021-03-18; просмотров: 107; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!