Проверить выполнимость предпосылок МНК.

ВАРИАНТ № 4.

Для анализа зависимости объема потребления y (д.е.) домохозяйства от располагаемого дохода х (д.е.)отобрана выборка n = 10.

у	120	112	133	123	126	140	131	133	114	120
х	88	87	110	101	93	118	93	111	93	102

1. Оценить силу линейной зависимости между х и y .

Оценить значимость коэффициента линейной корреляции при уровне значимости б = 10%.

Для оценки тесноты линейной зависимости между х и y вычислим коэффициент корреляции по формуле:

Представим исходные данные и расчетные показатели в виде расчетной таблицы.

Таблица 1

№ п/п	х	y	x ²	xy	y²
1	88	120	7744	10560	14400
2	87	112	7569	9744	12544
3	110	133	12100	14630	17689
4	101	123	10201	12423	15129
5	93	126	8649	11718	15876
6	118	140	13924	16520	19600
7	93	131	8649	12183	17161
8	111	133	12321	14763	17689
9	93	114	8649	10602	12996
10	102	120	10404	12240	14400
Сумма	996	1252	100210	125383	157484
Среднее	99,6	125,2	10021	12538,3	1574,84
Среднее

Имеем:

у_x²= - = 10021 – 99,6² = 100,84;

у_y²= - = 15748,4 – 125,2² = 73,36

Значение коэффициента корреляции позволяет сделать вывод о достаточно тесной (прямой) линейной зависимости х и y.

Для проверки значимости коэффициента корреляции вычислим наблюдаемое значение статистики.

При б = 0,1, k = n – 2 = 8 по таблицам критических точек распределения Стьюдента находим t _кр_. = 1,86. Поскольку > t _кр, то коэффициент корреляции r _х _y статистически значим, то есть имеется линейная зависимость между переменными x и y.

2. Построить линейную регрессионную модель: предварительно расположить значения y в порядке возрастания значений x .

По методу МНК на основе имеющихся данных

Рассчитать оценки параметров модели.

Согласно МНК для определения параметров a и b линейной регрессии ŷ = а + b х решаем систему нормальных уравнений вида:

Решение системы:

Представим исходные и расчетные данные в виде таблицы, предварительно расположив значения y в порядке возрастания значений х.

Таблица 2.

№ п/п	x	y	x²	xy	y²	ŷ	y - ŷ	(y–ŷ )²	A	(y- )²
1	87	112	7569	9744	12544	116,656	-4,656	21,68	4,16	174,24
2	88	120	7744	10560	14400	117,334	2,666	7,11	2,22	27,04
3	93	126	8649	11718	15876	120,724	5,276	27,84	4,19	0,64
4	93	131	8649	12183	17161	120,724	10,276	105,60	7,84	33,64
5	93	114	8649	10602	12996	120,724	-6,724	45,21	5,90	125,44
6	101	123	10201	12423	15129	126,149	-3,149	9,92	2,56	4,84
7	102	120	1044	12240	14400	126,827	-6,827	46,61	5,69	27,04
8	110	133	12100	14630	17689	132,252	0,748	0,56	0,56	60,84
9	111	133	12321	14763	17689	132,930	0,070	0,005	0,05	60,84
10	118	140	13924	16520	19600	137,677	2,323	5,40	1,66	219,04
Сумма	996	1252	100210	125383	157484	1252	0,00	269,94	34,83	733,6
Среднее	99,6	125,2	10021	12538,3	15748,4	125,2	0,00	26,994	3,48	73,36

Находим:

b = = 0,6781;

a = 125,2 – 0,6781·99,6 = 57,661

Уравнение парной линейной регрессии имеет вид:

ŷ = 57,661 + 0,6781х.

Подставляя в уравнение регрессии фактические значения х, определим теоретические (расчетные) значения ŷ (Таблица 2).

На одном чертеже отобразить график модели

И наблюдаемые значения.

Нанесем точки наблюдений (х_i ; y_i ), (где i = 1, 2, … 10) на декартову систему координат и отобразим график модели:

ŷ = 57,661 + 0,6781х. (рис. 1)

Рис. 1

4. Оценить качество уравнения регрессии:

а) Мерой общего качества уравнения регрессии является коэффициент детерминации R². В случае парной линейной регрессии

R²=

Получим: R²= 0,795² = 0,632

Таким образом, вариация зависимой переменной у – объема потребления – на 63,2% объясняется изменчивостью объясняющей переменной х – располагаемым доходом домохозяйства.

Значение коэффициента детерминации свидетельствует о достаточно хорошем общем качестве построенного уравнения регрессии.

б) Оценим на уровне б = 0,05 значимость уравнения регрессии.

Уравнение регрессии значимо, если наблюдаемое значение статистики

F = > F_б; k₁; k₂ ;

где F_б; k₁; k₂- табличное значение F – критерия Фишера, определенное на уровне значимости б при k₁= m и k₂=n – m -1 степенях свободы (n – число наблюдений, m – число параметров при переменных x).

Вычислим необходимые суммы квадратов. В таблице 2 найдены:

У(у - ŷ)² = 269,94

У(у - )²= 733,6

У(ŷ - )² = 733,6 – 269,94 = 463,66

Получим:

F = 13,74

По таблице F – распределения F_0,05;1;8 = 5,32.

Так как F > F_{0,05; 1; 8}, то уравнение регрессии значимо, то есть достаточно качественно отражает динамику изменения зависимой переменной.

в) Рассчитаем величину средней ошибки аппроксимации по формуле:

(Расчет представлен в Таблице 2)

То есть в среднем расчетные значения ŷ отклоняются от фактических у на 3,48%.

Величина не превышает 5%, что говорит о хорошем подборе модели к исходным данным.

Проверить выполнимость предпосылок МНК.

Предпосылки МНК.

I . Случайное отклонение Е_i есть величина случайная, а объясняющая переменная х_i – величина не случайная. (i=1,2,…n).

II . Математическое ожидание случайного отклонения Е_i равно нулю: М(Е_i) = 0.

III . Дисперсия случайного отклонения постоянна для всех наблюдений: D(Е_i) = D(Е_j) = у².

IV . Случайные отклонения Е_i и Е_j некоррелированы.

V . Случайное отклонение Е_i - есть нормально распределенная случайная величина.

После оценки параметров модели разность фактических и теоретических значений зависимой переменной, то есть е_i = у_i - ŷ, определяет оценки случайного отклонение Е_i (или остаток регрессии).

I . Проверим случайный характер остатков.

С этой целью строится график зависимости остатков е_i от теоретических значений зависимой переменной ŷ_i. (рис. 2).

Рис. 2

На рисунке 2 остатки представляют собой случайные величины.

II . Вторая предпосылка МНК означает, что У (у - ŷ) = У е_i = 0.

По данным таблицы 2, У (у - ŷ) = 0, то есть вторая предпосылка выполнена.

III . Дисперсия случайных отклонений Е_i должна быть постоянной для всех наблюдений, то есть D(Е_i) = D(Е_j) = у².

Выполнимость данного условия называется гомоскедастичностью, невыполняемость – гетероскедастичностью.

Наличие гетероскедастичности можно наглядно видеть из поля корреляции.

Поле корреляции представлено на рис. 1, на котором приведена зависимость переменной у от х, упорядоченных по возрастанию.

Представленная на рис. 1 диаграмма имеет пики, в целом подобный рисунок может соответствовать как гомо-, так и гетероскедастичной выборке. Чтобы определить, какая же именно ситуация имеет место, будем использовать тест ранговой корреляции Спирмена.

В качестве нулевой гипотезы H₀ будем использовать гипотезу об отсутствии гетероскедастичности. Предполагается, что дисперсия случайного отклонения будет либо увеличиваться, либо уменьшаться с увеличением значений х, поэтому для регрессии, абсолютные величины остатков е_i и значении х_i будут коррелированны.

Значения е_i и х_i ранжируются (упорядочиваются по величинам) и определяется коэффициент ранговой корреляции:

с_хе=1 -

где d_i – разность между рангами е_i и х_i_.

Представим исходные данные и расчетные показатели в виде таблицы.

Таблица 3.

№ п/п	х _i _.		Ранг х _i _.	Ранг е _i	d
1	87	4,656	1	6	25
2	88	2,666	2	4	4
3	93	5,276	4	7	9
4	93	10,276	4	10	36
5	93	6,724	4	8	16
6	101	3,149	6	5	1
7	102	6,827	7	9	4
8	110	0,748	8	2	36
9	111	0,070	9	1	64
10	118	2,323	10	3	49
Сумма	-	-	-	-	244

Находим: с_хе= 1 -

Оценим значимость с_хе:

t =

t_kp (при б = 0,05; k = 8) = 2,31

Так как = 1,55 < t_kp = 2,31, то с_хе – незначим, в этом случае гипотеза об отсутствии гетероскедастичности принимается (III предпосылка выполнена).

IV. Предпосылка – отсутствие автокорреляции остатков.

Оценим наличие автокорреляции с помощью статистики DW Дарбина – Уотсона:

DW = ;

Составим расчетную таблицу.

Таблица 4.

№ п/п	е _i	e_i-1	( е _i - e_i-1)²
1	-4,66	-	-
2	2,67	-4,66	53,73
3	5,28	2,67	6,81
4	10,28	5,28	25
5	-6,72	10,28	289
6	-3,15	-6,72	12,74
7	-6,83	-3,15	13,54
8	0,75	-6,83	57,46
9	0,07	0,75	0,46
10	2,32	0,07	5,06
Сумма	-	-	463,8

Получим: DW =

По таблице критических точек Дарбина – Уотсона при n = 10 и уровне значимости б = 0,05 критические значения d_н = 0,879 и d_В = 1,32. То есть фактически найденное DW = 1,718 находится в пределах от d_Вдо 4 - d_В(1,32 < 1,718 < 2,68). В этом случае гипотеза об отсутствии автокорреляции не отклоняется, то есть имеются основания считать, что автокорреляция остатков отсутствует.

Дата добавления: 2019-02-12; просмотров: 185; Мы поможем в написании вашей работы!

Поделиться с друзьями:

12 Следующая ⇒

Мы поможем в написании ваших работ!