Источники эмпирических данных



За основу регрессионного анализа взяты данные Российского мониторинга экономического положения и здоровья населения НИУ – ВШЭ, так как на данный момент этот мониторинг наиболее полно сможет раскрыть факторы, влияющие на вероятность того, что ребёнок будет иметь проблемы с лишним весом. Для получения наиболее актуальных результатов на сегодняшний день, была взята последняя доступная репрезентативная выборка на сегодняшний день – за 2016 год. Использовался детский опросник.

Была выявлена следующая спецификация модели:

Зависимая переменная в эконометрическом анализе – переменная childhood obesity or excess weight, которая равна 1, если у ребёнка есть проблемы с избыточным весом, и 0, если индекс массы тела не выходит за пределы нормы. Независимыми переменными принимались соответственно: пол (gender); посещение ребёнком уроков физкультуры (fizkult); занятия до или после школы музыкой или рисованием (arts); посещение сети Интернет ребёнком до или после школы (internet); совместные занятия ребёнка спортом с родителями (sporttog); совместные занятия ребёнка творчеством с родителями (artstog); работала ли мать или другой родственник в декретном отпуске (по уходу за этим ребёнком) (hwtog); совместное времяпрепровождение за дополнительными занятиями, выбранными родителями или ребёнком (additog); общение ребёнка со сверстниками (peers); возраст (age).

Для проведения исследования была выбрана logit регрессия, которая строилась в программном обеспечении Stata. Данные включали в себя ответы на вопросы родителей детей от 2 до 14 лет. Суммарная статистика включает в себя 386 наблюдений. Зависимая переменная строилась с помощью показателя «индекс массы тела», который в свою очередь, рассчитывался по формуле ИМТ=вес(кг)/рост(м)^2. Показатели роста и веса были взяты из базы РЛМС [РЛМС, 2016], при этом для индекса массы тела брались такие показатели: ИМТ<13 – недостаток веса, 13<ИМТ<21 – нормальный вес, ИМТ >21 – избыточный вес. 20% детей страдали избыточным весом, и 4% - ожирением.

Проверка качества модели

Так как одной из гипотез было отсутствие какого-либо разделения между мальчиками и девочками, рассматривалась совокупная выборка.  В качестве необходимого уровня значимости был взят базовый – 5%.

Результаты оценки модели для детей 2-14 лет представлены в таблице 4.

Таблица 4. Результаты оценки регрессионной модели

Переменная

Коэффициент

Значимость (P>|z|)

gender

0.4810881  

0.568

sporttog

1.080859

0.469

hwtog

-4.464919

0.003

internet    

9.353962

0.000

peers 

2.701943

0.093

age

0.393644

0.007

artstog

4.26904

0.003

addittog

-1.101355

0.422

fizkult

-5.378843

0.006

arts

1.083341

0.431

Построенная регрессионная модель основывается на исследовании компромисса, с которым сталкиваются родители. А именно, в регрессии рассматривается переменная, которая отражает, работала ли мать во время декретного отпуска или нет, а также занимаются ли родители спортом вместе с ребёнком, рисованием.

Этот компромисс в последние годы постоянно изменяется. На данный момент, альтернативная стоимость времяпрепровождения с ребёнком увеличилась, и стала столь высокой, какой никогда раньше не была [Huffman, Rizov, 2007].

В таблице 5 представлены результаты регрессии с указанием значимости коэффициентов. Если p – value превышает выбранный уровень значимости, то основная гипотеза (о равенстве коэффициента 0) не отвергается. Если коэффициент значим, то отмечено, на каком уровне значимости (1-10%).  Была проверена гипотеза об адекватности регрессии. Регрессия адекватна на любом разумном уровне значимости, - гипотеза H0 отвергается.

,

Таблица 5. Значимость коэффициентов регрессии

Переменная

Коэффициент

Значимость на 5%

gender 

0.4811   

Не значим

sporttog  

1.0809  

Не значим

hwtog 

-4.4649**  

Значим

internet  

9.3540*** 

Значим

peers

2.7019*

Не значим

age  

0.3936**  

Значим

artstog

4.2690**  

Значим

addittog   

-1.1014  

Не значим

fizkult    

-5.3788***

Значим

arts

1.0833   

Не значим

_cons 

-7.1927   

Значим

легенда: * p<0.05, ** p<0.01, *** p<0.001

Для того, чтобы определить, существует ли проблема мультиколлинеарности, был проведён VIF – коэффициент “вздутия” регрессии - тест, результаты которого приведены в приложении.

VIF =

По результатам теста было выделено, что мультиколлинеарности нет.

Процент правильно предсказанных переменных для построенной модели равен 96%, Pseudo R2=0,8341 (Приложение). Модель также обладает высокой чувствительностью (98%) и специфичностью (91%).

Оценка качества подгонки модели по критерию согласия Хосмера-Лемешева, представленная в таблице 6, отображает то, что гипотеза о допустимо незначительных расхождениях между фактической классификацией и предсказанной, отклоняется. P – value критерия согласия составляет 0,6074, а, значит отвергается при уровне значимости 5%.

Таблица 6. Оценка подгонки модели по критерию согласия Хосмера – Лемешева

Количество наблюдений 386
Количество группа 10
Хосмер – Лемешев chi2(8) 6,36
 Prob > chi2 0,6074

Наличие гетероскедастичности выдаёт присутствие в выборке неоднородных наблюдений. В данной модели проблема гетероскедастичности была решена с помощью команды «robust». После коррекции были получены результаты, приведённые в приложении.


Дата добавления: 2019-07-17; просмотров: 191; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!