Проверить выполнимость предпосылок МНК.



ВАРИАНТ № 4.

Для анализа зависимости объема потребления y (д.е.) домохозяйства от располагаемого дохода х (д.е.)отобрана выборка n = 10.

 

у 120 112 133 123 126 140 131 133 114 120
х 88 87 110 101 93 118 93 111 93 102

 

 

1. Оценить силу линейной зависимости между х и y .

Оценить значимость коэффициента линейной корреляции при уровне значимости б = 10%.

Для оценки тесноты линейной зависимости между х и y вычислим коэффициент корреляции по формуле:

 

Представим исходные данные и расчетные показатели в виде расчетной таблицы.

 

 

Таблица 1

№   п/п х y x 2 xy y2
1 88 120 7744 10560 14400
2 87 112 7569 9744 12544
3 110 133 12100 14630 17689
4 101 123 10201 12423 15129
5 93 126 8649 11718 15876
6 118 140 13924 16520 19600
7 93 131 8649 12183 17161
8 111 133 12321 14763 17689
9 93 114 8649 10602 12996
10 102 120 10404 12240 14400
Сумма 996 1252 100210 125383 157484

Среднее

99,6 125,2 10021 12538,3 1574,84

 

 

Имеем:

 

уx2 =  -  = 10021 – 99,62 = 100,84;

 

 

уy2 =  -  = 15748,4 – 125,22 = 73,36

 

 

 

 

Значение коэффициента корреляции позволяет сделать вывод о достаточно тесной (прямой) линейной зависимости х и y.

Для проверки значимости коэффициента корреляции вычислим наблюдаемое значение статистики.

 

 

 

 

При б = 0,1, k = n – 2 = 8 по таблицам критических точек распределения Стьюдента находим t кр. = 1,86. Поскольку  > t кр, то коэффициент корреляции r х y статистически значим, то есть имеется линейная зависимость между переменными x и y.

 

 

2. Построить линейную регрессионную модель: предварительно расположить значения y в порядке возрастания значений x .

По методу МНК на основе имеющихся данных

Рассчитать оценки параметров модели.

Согласно МНК для определения параметров a и b линейной регрессии ŷ = а + b х решаем систему нормальных уравнений вида:

 

 

 

Решение системы:

 

 

Представим исходные и расчетные данные в виде таблицы, предварительно расположив значения y в порядке возрастания значений х.

 

Таблица 2.

№ п/п x y x2 xy y2 ŷ y - ŷ (y–ŷ )2 A (y- )2
1 87 112 7569 9744 12544 116,656 -4,656 21,68 4,16 174,24
2 88 120 7744 10560 14400 117,334 2,666 7,11 2,22 27,04
3 93 126 8649 11718 15876 120,724 5,276 27,84 4,19 0,64
4 93 131 8649 12183 17161 120,724 10,276 105,60 7,84 33,64
5 93 114 8649 10602 12996 120,724 -6,724 45,21 5,90 125,44
6 101 123 10201 12423 15129 126,149 -3,149 9,92 2,56 4,84
7 102 120 1044 12240 14400 126,827 -6,827 46,61 5,69 27,04
8 110 133 12100 14630 17689 132,252 0,748 0,56 0,56 60,84
9 111 133 12321 14763 17689 132,930 0,070 0,005 0,05 60,84
10 118 140 13924 16520 19600 137,677 2,323 5,40 1,66 219,04
Сумма 996 1252 100210 125383 157484 1252 0,00 269,94 34,83 733,6
Среднее 99,6 125,2 10021 12538,3 15748,4 125,2 0,00 26,994 3,48 73,36

 

Находим:

 

b =  = 0,6781;

 

 

a = 125,2 – 0,6781·99,6 = 57,661

 

 

Уравнение парной линейной регрессии имеет вид:

 

 ŷ = 57,661 + 0,6781х.

Подставляя в уравнение регрессии фактические значения х, определим теоретические (расчетные) значения ŷ (Таблица 2).

 

На одном чертеже отобразить график модели

И наблюдаемые значения.

 

Нанесем точки наблюдений (хi ; yi ), (где i = 1, 2, … 10) на декартову систему координат и отобразим график модели:

 

 

 ŷ = 57,661 + 0,6781х. (рис. 1)

 

Рис. 1

 

 

 

4. Оценить качество уравнения регрессии:

а)   Мерой общего качества уравнения регрессии является коэффициент детерминации R2 . В случае парной линейной регрессии  

 

R2 =

 

Получим: R2 = 0,7952 = 0,632

 

Таким образом, вариация зависимой переменной у – объема потребления – на 63,2% объясняется изменчивостью объясняющей переменной х – располагаемым доходом домохозяйства.

Значение коэффициента детерминации свидетельствует о достаточно хорошем общем качестве построенного уравнения регрессии.

 

б)    Оценим на уровне б = 0,05 значимость уравнения регрессии.

Уравнение регрессии значимо, если наблюдаемое значение статистики

 

F =   > Fб; k1; k2 ;

 

где Fб; k1; k2 - табличное значение F – критерия Фишера, определенное на уровне значимости б при k1 = m  и k2 =n – m -1 степенях свободы (n – число наблюдений, m – число параметров при переменных x).

Вычислим необходимые суммы квадратов. В таблице 2 найдены:

 

У(у - ŷ)2 = 269,94

 

 

У(у - )2 = 733,6

 

 

У(ŷ - )2 = 733,6 – 269,94 = 463,66

 

 

Получим:

 

 

F = 13,74

 

 

По таблице F – распределения F0,05;1;8 = 5,32.

 

Так как F > F0,05; 1; 8, то уравнение регрессии значимо, то есть достаточно качественно отражает динамику изменения зависимой переменной.

 

 

в) Рассчитаем величину средней ошибки аппроксимации по формуле:

 

 

                                                                       (Расчет представлен в Таблице 2)

 

То есть в среднем расчетные значения ŷ отклоняются от фактических у на 3,48%.

Величина  не превышает 5%, что говорит о хорошем подборе модели к исходным данным.

 

 

Проверить выполнимость предпосылок МНК.

Предпосылки МНК.

I . Случайное отклонение Еi есть величина случайная, а объясняющая переменная хi – величина не случайная. (i=1,2,…n).

II . Математическое ожидание случайного отклонения  Еi равно нулю: М(Еi) = 0.

III . Дисперсия случайного отклонения постоянна для всех наблюдений: D(Еi) = D(Еj) = у2.

IV . Случайные отклонения Еi и Еj некоррелированы.

V . Случайное отклонение Еi - есть нормально распределенная случайная величина.

 

После оценки параметров модели разность фактических и теоретических значений зависимой переменной, то есть еi = уi -  ŷ, определяет оценки случайного отклонение Еi (или остаток регрессии).

 

I . Проверим случайный характер остатков.

С этой целью строится график зависимости остатков еi от теоретических значений зависимой переменной ŷi. (рис. 2).

 

 

 

Рис. 2

 

 

На рисунке 2 остатки представляют собой случайные величины.

 

 

II . Вторая предпосылка МНК означает, что У (у -  ŷ) = У еi = 0.

По данным таблицы 2, У (у -  ŷ) = 0, то есть вторая предпосылка выполнена.

 

III . Дисперсия случайных отклонений Еi должна быть постоянной для всех наблюдений, то есть D(Еi) = D(Еj) = у2.

Выполнимость данного условия называется гомоскедастичностью, невыполняемость – гетероскедастичностью.

Наличие гетероскедастичности можно наглядно видеть из поля корреляции.

Поле корреляции представлено на рис. 1, на котором приведена зависимость переменной у от х, упорядоченных по возрастанию.

Представленная на рис. 1 диаграмма имеет пики, в целом подобный рисунок может соответствовать как гомо-, так и гетероскедастичной выборке. Чтобы определить, какая же именно ситуация имеет место, будем использовать тест ранговой корреляции Спирмена.

В качестве нулевой гипотезы H0 будем использовать гипотезу об отсутствии гетероскедастичности. Предполагается, что дисперсия случайного отклонения будет либо увеличиваться, либо уменьшаться с увеличением значений х, поэтому для регрессии, абсолютные величины остатков еi и значении хi будут коррелированны.

Значения еi и хi ранжируются (упорядочиваются по величинам) и определяется коэффициент ранговой корреляции:

 

        схе=1 -

 

где di – разность между рангами еi и хi.

Представим исходные данные и расчетные показатели в виде таблицы.

 

Таблица 3.

№ п/п х i . Ранг х i . Ранг е i d
1 87 4,656 1 6 25
2 88 2,666 2 4 4
3 93 5,276 4 7 9
4 93 10,276 4 10 36
5 93 6,724 4 8 16
6 101 3,149 6 5 1
7 102 6,827 7 9 4
8 110 0,748 8 2 36
9 111 0,070 9 1 64
10 118 2,323 10 3 49
Сумма - - - - 244

 

Находим:                      схе = 1 -

 

 

Оценим значимость схе:                 

 

 

t =

 

 

tkp (при б = 0,05; k = 8) = 2,31

Так как  = 1,55 <  tkp = 2,31, то схе – незначим, в этом случае гипотеза об отсутствии гетероскедастичности принимается (III предпосылка выполнена).

 

IV. Предпосылка – отсутствие автокорреляции остатков.

Оценим наличие автокорреляции с помощью статистики DW Дарбина – Уотсона:

 

DW = ;

 

 

Составим расчетную таблицу.

 

 

Таблица 4.

№ п/п е i ei-1 ( е i - ei-1)2
1 -4,66 - -
2 2,67 -4,66 53,73
3 5,28 2,67 6,81
4 10,28 5,28 25
5 -6,72 10,28 289
6 -3,15 -6,72 12,74
7 -6,83 -3,15 13,54
8 0,75 -6,83 57,46
9 0,07 0,75 0,46
10 2,32 0,07 5,06
Сумма - - 463,8

 

 

Получим:             DW =

 

По таблице критических точек Дарбина – Уотсона при n = 10 и уровне значимости б = 0,05 критические значения dн = 0,879 и dВ = 1,32. То есть фактически найденное DW = 1,718 находится в пределах от dВ до 4 - dВ (1,32 < 1,718 < 2,68). В этом случае гипотеза об отсутствии автокорреляции не отклоняется, то есть имеются основания считать, что автокорреляция остатков отсутствует.

 

 


Дата добавления: 2019-02-12; просмотров: 185; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!