Источники эмпирических данных

⇐ ПредыдущаяСтр 5 из 8Следующая ⇒

За основу регрессионного анализа взяты данные Российского мониторинга экономического положения и здоровья населения НИУ – ВШЭ, так как на данный момент этот мониторинг наиболее полно сможет раскрыть факторы, влияющие на вероятность того, что ребёнок будет иметь проблемы с лишним весом. Для получения наиболее актуальных результатов на сегодняшний день, была взята последняя доступная репрезентативная выборка на сегодняшний день – за 2016 год. Использовался детский опросник.

Была выявлена следующая спецификация модели:

Зависимая переменная в эконометрическом анализе – переменная childhood obesity or excess weight, которая равна 1, если у ребёнка есть проблемы с избыточным весом, и 0, если индекс массы тела не выходит за пределы нормы. Независимыми переменными принимались соответственно: пол (gender); посещение ребёнком уроков физкультуры (fizkult); занятия до или после школы музыкой или рисованием (arts); посещение сети Интернет ребёнком до или после школы (internet); совместные занятия ребёнка спортом с родителями (sporttog); совместные занятия ребёнка творчеством с родителями (artstog); работала ли мать или другой родственник в декретном отпуске (по уходу за этим ребёнком) (hwtog); совместное времяпрепровождение за дополнительными занятиями, выбранными родителями или ребёнком (additog); общение ребёнка со сверстниками (peers); возраст (age).

Для проведения исследования была выбрана logit регрессия, которая строилась в программном обеспечении Stata. Данные включали в себя ответы на вопросы родителей детей от 2 до 14 лет. Суммарная статистика включает в себя 386 наблюдений. Зависимая переменная строилась с помощью показателя «индекс массы тела», который в свою очередь, рассчитывался по формуле ИМТ=вес(кг)/рост(м)^2. Показатели роста и веса были взяты из базы РЛМС [РЛМС, 2016], при этом для индекса массы тела брались такие показатели: ИМТ<13 – недостаток веса, 13<ИМТ<21 – нормальный вес, ИМТ >21 – избыточный вес. 20% детей страдали избыточным весом, и 4% - ожирением.

Проверка качества модели

Так как одной из гипотез было отсутствие какого-либо разделения между мальчиками и девочками, рассматривалась совокупная выборка. В качестве необходимого уровня значимости был взят базовый – 5%.

Результаты оценки модели для детей 2-14 лет представлены в таблице 4.

Таблица 4. Результаты оценки регрессионной модели

Переменная	Коэффициент	Значимость (P>\|z\|)
gender	0.4810881	0.568
sporttog	1.080859	0.469
hwtog	-4.464919	0.003
internet	9.353962	0.000
peers	2.701943	0.093
age	0.393644	0.007
artstog	4.26904	0.003
addittog	-1.101355	0.422
fizkult	-5.378843	0.006
arts	1.083341	0.431

Построенная регрессионная модель основывается на исследовании компромисса, с которым сталкиваются родители. А именно, в регрессии рассматривается переменная, которая отражает, работала ли мать во время декретного отпуска или нет, а также занимаются ли родители спортом вместе с ребёнком, рисованием.

Этот компромисс в последние годы постоянно изменяется. На данный момент, альтернативная стоимость времяпрепровождения с ребёнком увеличилась, и стала столь высокой, какой никогда раньше не была [Huffman, Rizov, 2007].

В таблице 5 представлены результаты регрессии с указанием значимости коэффициентов. Если p – value превышает выбранный уровень значимости, то основная гипотеза (о равенстве коэффициента 0) не отвергается. Если коэффициент значим, то отмечено, на каком уровне значимости (1-10%). Была проверена гипотеза об адекватности регрессии. Регрессия адекватна на любом разумном уровне значимости, - гипотеза H₀отвергается.

Таблица 5. Значимость коэффициентов регрессии

Переменная

Коэффициент

Значимость на 5%

gender

0.4811

Не значим

sporttog

1.0809

Не значим

hwtog

-4.4649**

Значим

internet

9.3540***

Значим

peers

2.7019*

Не значим

age

0.3936**

Значим

artstog

4.2690**

Значим

addittog

-1.1014

Не значим

fizkult

-5.3788***

Значим

arts

1.0833

Не значим

_cons

-7.1927

Значим

легенда: * p<0.05, ** p<0.01, *** p<0.001

Для того, чтобы определить, существует ли проблема мультиколлинеарности, был проведён VIF – коэффициент “вздутия” регрессии - тест, результаты которого приведены в приложении.

VIF =

По результатам теста было выделено, что мультиколлинеарности нет.

Процент правильно предсказанных переменных для построенной модели равен 96%, Pseudo R2=0,8341 (Приложение). Модель также обладает высокой чувствительностью (98%) и специфичностью (91%).

Оценка качества подгонки модели по критерию согласия Хосмера-Лемешева, представленная в таблице 6, отображает то, что гипотеза о допустимо незначительных расхождениях между фактической классификацией и предсказанной, отклоняется. P – value критерия согласия составляет 0,6074, а, значит отвергается при уровне значимости 5%.

Таблица 6. Оценка подгонки модели по критерию согласия Хосмера – Лемешева

Количество наблюдений	386
Количество группа	10
Хосмер – Лемешев chi2(8)	6,36
Prob > chi2	0,6074

Наличие гетероскедастичности выдаёт присутствие в выборке неоднородных наблюдений. В данной модели проблема гетероскедастичности была решена с помощью команды «robust». После коррекции были получены результаты, приведённые в приложении.

Дата добавления: 2019-07-17; просмотров: 191; Мы поможем в написании вашей работы!

Поделиться с друзьями:

⇐ Предыдущая 1 2 3 456 7 8 Следующая ⇒

Мы поможем в написании ваших работ!