Источники эмпирических данных
За основу регрессионного анализа взяты данные Российского мониторинга экономического положения и здоровья населения НИУ – ВШЭ, так как на данный момент этот мониторинг наиболее полно сможет раскрыть факторы, влияющие на вероятность того, что ребёнок будет иметь проблемы с лишним весом. Для получения наиболее актуальных результатов на сегодняшний день, была взята последняя доступная репрезентативная выборка на сегодняшний день – за 2016 год. Использовался детский опросник.
Была выявлена следующая спецификация модели:
Зависимая переменная в эконометрическом анализе – переменная childhood obesity or excess weight, которая равна 1, если у ребёнка есть проблемы с избыточным весом, и 0, если индекс массы тела не выходит за пределы нормы. Независимыми переменными принимались соответственно: пол (gender); посещение ребёнком уроков физкультуры (fizkult); занятия до или после школы музыкой или рисованием (arts); посещение сети Интернет ребёнком до или после школы (internet); совместные занятия ребёнка спортом с родителями (sporttog); совместные занятия ребёнка творчеством с родителями (artstog); работала ли мать или другой родственник в декретном отпуске (по уходу за этим ребёнком) (hwtog); совместное времяпрепровождение за дополнительными занятиями, выбранными родителями или ребёнком (additog); общение ребёнка со сверстниками (peers); возраст (age).
Для проведения исследования была выбрана logit регрессия, которая строилась в программном обеспечении Stata. Данные включали в себя ответы на вопросы родителей детей от 2 до 14 лет. Суммарная статистика включает в себя 386 наблюдений. Зависимая переменная строилась с помощью показателя «индекс массы тела», который в свою очередь, рассчитывался по формуле ИМТ=вес(кг)/рост(м)^2. Показатели роста и веса были взяты из базы РЛМС [РЛМС, 2016], при этом для индекса массы тела брались такие показатели: ИМТ<13 – недостаток веса, 13<ИМТ<21 – нормальный вес, ИМТ >21 – избыточный вес. 20% детей страдали избыточным весом, и 4% - ожирением.
|
|
Проверка качества модели
Так как одной из гипотез было отсутствие какого-либо разделения между мальчиками и девочками, рассматривалась совокупная выборка. В качестве необходимого уровня значимости был взят базовый – 5%.
Результаты оценки модели для детей 2-14 лет представлены в таблице 4.
Таблица 4. Результаты оценки регрессионной модели
Переменная | Коэффициент | Значимость (P>|z|) |
gender | 0.4810881 | 0.568 |
sporttog | 1.080859 | 0.469 |
hwtog | -4.464919 | 0.003 |
internet | 9.353962 | 0.000 |
peers | 2.701943 | 0.093 |
age | 0.393644 | 0.007 |
artstog | 4.26904 | 0.003 |
addittog | -1.101355 | 0.422 |
fizkult | -5.378843 | 0.006 |
arts | 1.083341 | 0.431 |
Построенная регрессионная модель основывается на исследовании компромисса, с которым сталкиваются родители. А именно, в регрессии рассматривается переменная, которая отражает, работала ли мать во время декретного отпуска или нет, а также занимаются ли родители спортом вместе с ребёнком, рисованием.
|
|
Этот компромисс в последние годы постоянно изменяется. На данный момент, альтернативная стоимость времяпрепровождения с ребёнком увеличилась, и стала столь высокой, какой никогда раньше не была [Huffman, Rizov, 2007].
В таблице 5 представлены результаты регрессии с указанием значимости коэффициентов. Если p – value превышает выбранный уровень значимости, то основная гипотеза (о равенстве коэффициента 0) не отвергается. Если коэффициент значим, то отмечено, на каком уровне значимости (1-10%). Была проверена гипотеза об адекватности регрессии. Регрессия адекватна на любом разумном уровне значимости, - гипотеза H0 отвергается.
,
Таблица 5. Значимость коэффициентов регрессии
Переменная | Коэффициент | Значимость на 5% | ||
gender | 0.4811 | Не значим | ||
sporttog | 1.0809 | Не значим | ||
hwtog | -4.4649** | Значим | ||
internet | 9.3540*** | Значим | ||
peers | 2.7019* | Не значим | ||
age | 0.3936** | Значим | ||
artstog
| 4.2690** | Значим | ||
addittog | -1.1014 | Не значим | ||
fizkult | -5.3788*** | Значим | ||
arts | 1.0833 | Не значим | ||
_cons | -7.1927 | Значим | ||
легенда: * p<0.05, ** p<0.01, *** p<0.001 |
Для того, чтобы определить, существует ли проблема мультиколлинеарности, был проведён VIF – коэффициент “вздутия” регрессии - тест, результаты которого приведены в приложении.
VIF =
По результатам теста было выделено, что мультиколлинеарности нет.
Процент правильно предсказанных переменных для построенной модели равен 96%, Pseudo R2=0,8341 (Приложение). Модель также обладает высокой чувствительностью (98%) и специфичностью (91%).
Оценка качества подгонки модели по критерию согласия Хосмера-Лемешева, представленная в таблице 6, отображает то, что гипотеза о допустимо незначительных расхождениях между фактической классификацией и предсказанной, отклоняется. P – value критерия согласия составляет 0,6074, а, значит отвергается при уровне значимости 5%.
Таблица 6. Оценка подгонки модели по критерию согласия Хосмера – Лемешева
Количество наблюдений | 386 |
Количество группа | 10 |
Хосмер – Лемешев chi2(8) | 6,36 |
Prob > chi2 | 0,6074 |
Наличие гетероскедастичности выдаёт присутствие в выборке неоднородных наблюдений. В данной модели проблема гетероскедастичности была решена с помощью команды «robust». После коррекции были получены результаты, приведённые в приложении.
|
|
Дата добавления: 2019-07-17; просмотров: 191; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!