ВЫПОЛНЕНИЕ ИНДИВИДУАЛЬНОГО ВАРИАНТА
АНОО ВПО «ИНСТИТУТ ЭКОНОМИКИ И УПРАВЛЕНИЯ В МЕДИЦИНЕ И СОЦИАЛЬНОЙ СФЕРЕ»
Экономико-правовой факультет
КАФЕДРА МАТЕМАТИЧЕСКИХ И ЕСТЕСТВЕННОНАУЧНЫХ ДИСЦИПЛИН
Н.Ю. Нарыжная
ЗАЧЕТНОЕ ЗАДАНИЕ ПО ЭКОНОМЕТРИКЕ
Тема: Парная линейная регрессия
Вариант: __________ Задание выполнил (а) студент (ка) ________ курса ___________________ группы __________________________ факультета заочной формы обучения ФИО ________________________________ _____________________________________ |
Проверил (а) доцент кафедры математических и естественнонаучных дисциплин, к.т.н. Н.Ю. Нарыжная Оценка ______________________________ «______» ___________________ 20_____ г. _____________________________________ подпись |
Краснодар 2014
Задание:
По n районам некоторого региона известны данные за январь 20___ года (см. таблицу, соответствующую Вашему варианту) о потребительских расходах на душу населения y и средней заработной плате и выплатам социального характера х.
1. Постройте поле корреляции и сформулируйте гипотезу о форме связи.
2. Рассчитайте параметры линейного уравнения регрессии.
3. Оцените тесноту связи с помощью показателей корреляции и детерминации.
4. Дайте с помощью среднего (общего) коэффициента эластичности сравнительную оценку силы связи фактора с результатом.
5. Оцените с помощью средней ошибки аппроксимации качество уравнения.
|
|
6. Оцените с помощью F-критерия Фишера статистическую надежность результатов регрессионного моделирования.
7. Рассчитайте прогнозное значение результата, если прогнозное значение фактора увеличится на 7% от его среднего уровня. Определите доверительный интервал прогноза для уровня значимости a=0,05.
ПРИМЕР ВЫПОЛНЕНИЯ РАСЧЕТОВ
(выполняется совместно с преподавателем в аудитории)
Район | Потребительские расходы на душу населения (у.е), у | Средняя заработная плата и выплаты социального характера (у.е.), х |
1 | ||
2 | ||
3 | ||
4 | ||
5 | ||
6 | ||
7 | ||
8 | ||
9 | ||
10 | ||
11 | ||
12 | ||
13 | ||
14 |
Решение.
1) Построение поля корреляции:
у | ||||||||||||||||||||||||
х |
2) Построение и анализ линейной модели регрессии:
|
|
|
|
|
|
Для расчета параметров a и b линейной регрессии y = a + b x , в соответствии с методом наименьших квадратов,необходимо решить систему нормальных уравнений относительно a и b:
Из этой системы получаются следующие формулы:
b = ; (1)
а= (2)
По исходным данным рассчитываем S y, S x, S y x, S x2, S у2. Для удобства результаты вычислений заносим в таблицу 1:
Таблица 1
i | yi | xi | yi xi | xi2 | yi2 | yxi | y - yxi | Ai |
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
1 | ||||||||
2 | ||||||||
3 | ||||||||
4 | ||||||||
5 | ||||||||
6 | ||||||||
7 | ||||||||
8 | ||||||||
9 | ||||||||
10 | ||||||||
11 | ||||||||
12 | ||||||||
13 | ||||||||
14 | ||||||||
Сумма | ||||||||
Среднее значение | * | * |
Подставляя полученные средние значения в формулы (1) и (2), находим
b =
а=
Получили следующее уравнение линейной регрессии: y = ___ ____ ∙ x .
Из уравнения следует, что с увеличением заработной платы на 1 у.е. доля расходов на ________________________ в среднем на ___ % - ных пункта.
3) Для оценки тесноты связи изучаемых явлений рассчитаем линейный коэффициент парной корреляции:
rxy = =
Полученное значение rxy показывает, что связь ______________________________________.
4)
а) Определим коэффициент детерминации R 2, который характеризует долю дисперсии, объясняемую регрессией, в общей дисперсии результативного признака:
R 2 =rxy 2 =
Значение R 2 указывает на то, что вариация результативного признака у на _______ % объясняется вариацией признак - фактора х.
б). Оценку качества полученного уравнения регрессии дает также средняя ошибка аппроксимации Ā.
Для того, чтобы вычислить Ā, произведем следующие расчеты:
подставим в уравнение регрессии фактические значения х и определим теоретические (расчетные) значения ŷх (заполняем 7-ой столбец таблицы 1);
найдем разности y - ŷxi (8-ой столбец таблицы 1) и величины А i = %(9-й столбец таблицы 1).
Теперь находим
Ā = Σ Ai / n =
Как видим, в среднем расчетные значения отклоняются от фактических на __________%, что
_______________________________________________________________________________.
в) Оценим качество уравнения регрессии с помощью F -теста. F -тест состоит в проверке гипотезы Н0 о статистической незначимости уравнения регрессии и показателя тесноты связи. Для этого выполняется сравнение фактического Fфакт и критического (табличного) Fтабл значений F -критерия Фишера. Fфакт определяется из соотношения значений факторной и остаточной дисперсий, рассчитанных на одну степень свободы.
Рассчитаем фактическое значение F -критерия Фишера:
Fфакт =
Здесь n – число единиц совокупности; m – число параметров при переменных х.
В данной задаче получили Fтабл Fфакт , что указывает на необходимость принять (отвергнуть) гипотезу Н0 о случайной природе выявленной зависимости и статистической незначимости параметров уравнения регрессии и показателя тесноты связи.
СПРАВОЧНАЯ ИНФОРМАЦИЯ
Полем корреляции называется совокупность точек результативного и факторного признаков.
Построение уравнения линейной регрессии сводится к нахождению уравнения вида y = a+ bx, которое позволяет по заданным значениям фактора х иметь теоретические значения результативного признака (путем подстановки значений х в уравнение). Построение линейной регрессии сводится к оценке ее параметров а и b.
Классический подход к оцениванию параметров линейной регрессии основан на методе наименьших квадратов (МНК). МНК позволяет получить такие оценки параметров а и b, при которых сумма квадратов отклонений фактических значений результативного признака (у) от расчетных теоретических минимальна.
Параметр b называется коэффициентом регрессии. Его величина показывает среднее изменение результата с изменением фактора на одну единицу.
Коэффициент корреляции – показатель тесноты линейной связи между признаками у и х.
Если коэффициент корреляции по модулю близок к единице, то связь между признаками характеризуется как тесная линейная.
Если коэффициент корреляции по модулю близок к нулю, то имеет место слабая линейная зависимость.
Если коэффициент корреляции отрицателен, то связь признается обратной (т.е. большему значению фактора соответствует меньшее значение результата), если коэффициент положителен – прямой. Если значение коэффициента корреляции равно нулю, то изучаемые величины вообще не зависят друг от друга и связи между ними нет.
Квадрат индекса корреляции называется коэффициентом детерминации. Коэффициент детерминации характеризует качество подбора линейной функции.
Коэффициент эластичности показывает, на сколько процентов изменится в среднем результат, если фактор изменится в среднем на единицу.
Фактические значения результативного признака отличаются от теоретических, рассчитанных по уравнению регрессии. Чем меньше это отличие, тем ближе теоретические значения подходят к эмпирическим данным, тем лучше качество модели.
Средняя ошибка аппроксимации в пределах 5-7 % свидетельствует о хорошем подборе модели к исходным данным.
Fтабл – это максимально возможное значение критерия под влиянием случайных факторов при данных степенях свободы и уровне значимости α . Уровень значимости α – вероятность отвергнуть правильную гипотезу при условии, что она верна. Обычно α принимается равной 0,05 или 0,01.
Если Fтабл< Fфакт , то Н0 гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность. Если Fтабл> Fфакт , то гипотеза Н0 не отклоняется и признается статистическая незначимость и ненадежность уравнения регрессии.
Табличные значения F – критерия Фишера при уровне значимости 0,05 ( F ( m ; n -2) )
m | |||||||||||
n-2 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 15 |
1 | 161.45 | 199.50 | 215.71 | 224.58 | 230.16 | 233.99 | 236.77 | 238.88 | 240.54 | 241.88 | 245.95 |
2 | 18.51 | 19.00 | 19.16 | 19.25 | 19.30 | 19.33 | 19.35 | 19.37 | 19.38 | 19.40 | 19.43 |
3 | 10.13 | 9.55 | 9.28 | 9.12 | 9.01 | 8.94 | 8.89 | 8.85 | 8.81 | 8.79 | 8.70 |
4 | 7.71 | 6.94 | 6.59 | 6.39 | 6.26 | 6.16 | 6.09 | 6.04 | 6.00 | 5.96 | 5.86 |
5 | 6.61 | 5.79 | 5.41 | 5.19 | 5.05 | 4.95 | 4.88 | 4.82 | 4.77 | 4.74 | 4.62 |
6 | 5.99 | 5.14 | 4.76 | 4.53 | 4.39 | 4.28 | 4.21 | 4.15 | 4.10 | 4.06 | 3.94 |
7 | 5.59 | 4.74 | 4.35 | 4.12 | 3.97 | 3.87 | 3.79 | 3.73 | 3.68 | 3.64 | 3.51 |
8 | 5.32 | 4.46 | 4.07 | 3.84 | 3.69 | 3.58 | 3.50 | 3.44 | 3.39 | 3.35 | 3.22 |
9 | 5.12 | 4.26 | 3.86 | 3.63 | 3.48 | 3.37 | 3.29 | 3.23 | 3.18 | 3.14 | 3.01 |
10 | 4.96 | 4.10 | 3.71 | 3.48 | 3.33 | 3.22 | 3.14 | 3.07 | 3.02 | 2.98 | 2.85 |
11 | 4.84 | 3.98 | 3.59 | 3.36 | 3.20 | 3.09 | 3.01 | 2.95 | 2.90 | 2.85 | 2.72 |
12 | 4.75 | 3.89 | 3.49 | 3.26 | 3.11 | 3.00 | 2.91 | 2.85 | 2.80 | 2.75 | 2.62 |
13 | 4.67 | 3.81 | 3.41 | 3.18 | 3.03 | 2.92 | 2.83 | 2.77 | 2.71 | 2.67 | 2.53 |
14 | 4.60 | 3.74 | 3.34 | 3.11 | 2.96 | 2.85 | 2.76 | 2.70 | 2.65 | 2.60 | 2.46 |
15 | 4.54 | 3.68 | 3.29 | 3.06 | 2.90 | 2.79 | 2.71 | 2.64 | 2.59 | 2.54 | 2.40 |
16 | 4.49 | 3.63 | 3.24 | 3.01 | 2.85 | 2.74 | 2.66 | 2.59 | 2.54 | 2.49 | 2.35 |
17 | 4.45 | 3.59 | 3.20 | 2.96 | 2.81 | 2.70 | 2.61 | 2.55 | 2.49 | 2.45 | 2.31 |
18 | 4.41 | 3.55 | 3.16 | 2.93 | 2.77 | 2.66 | 2.58 | 2.51 | 2.46 | 2.41 | 2.27 |
19 | 4.38 | 3.52 | 3.13 | 2.90 | 2.74 | 2.63 | 2.54 | 2.48 | 2.42 | 2.38 | 2.23 |
20 | 4.35 | 3.49 | 3.10 | 2.87 | 2.71 | 2.60 | 2.51 | 2.45 | 2.39 | 2.35 | 2.20 |
Рекомендуемая литература:
1. Эконометрика. Под редакцией чл.- корр. РАН И.И. Елисеевой – М.: «Финансы и статистика», 2011.
2. Практикум по эконометрике. Под редакцией чл.-корр. РАН И.И. Елисеевой. – М.: «Финансы и статистика», 2012.
ВЫПОЛНЕНИЕ ИНДИВИДУАЛЬНОГО ВАРИАНТА
(выполняется студентом самостоятельно)
Район | Потребительские расходы на душу населения (у.е), у | Средняя заработная плата и выплаты социального характера (у.е.), х |
1 | ||
2 | ||
3 | ||
4 | ||
5 | ||
6 | ||
7 | ||
8 | ||
9 | ||
10 | ||
11 | ||
12 | ||
13 | ||
14 |
Решение.
1) Построение поля корреляции:
у | ||||||||||||||||||||||||
х |
2) Построение и анализ линейной модели регрессии:
Для расчета параметров a и b линейной регрессии y = a + b x , в соответствии с методом наименьших квадратов,необходимо решить систему нормальных уравнений относительно a и b:
Из этой системы получаются следующие формулы:
b = ; (1)
а= (2)
По исходным данным рассчитываем S y, S x, S y x, S x2, S у2. Для удобства результаты вычислений заносим в таблицу 1:
Таблица 1
i | yi | xi | yi xi | xi2 | yi2 | yxi | y - yxi | Ai |
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
1 | ||||||||
2 | ||||||||
3 | ||||||||
4 | ||||||||
5 | ||||||||
6 | ||||||||
7 | ||||||||
8 | ||||||||
9 | ||||||||
10 | ||||||||
11 | ||||||||
12 | ||||||||
13 | ||||||||
14 | ||||||||
Сумма | ||||||||
Среднее значение | * | * |
Подставляя полученные средние значения в формулы (1) и (2), находим
b =
а=
Получили следующее уравнение линейной регрессии: y = ___ ____ ∙ x .
Из уравнения следует, что с увеличением заработной платы на 1 у.е. доля расходов на ________________________ в среднем на ___ % - ных пункта.
3) Для оценки тесноты связи изучаемых явлений рассчитаем линейный коэффициент парной корреляции:
rxy = =
Полученное значение rxy показывает, что связь ______________________________________.
4)
а) Определим коэффициент детерминации R 2, который характеризует долю дисперсии, объясняемую регрессией, в общей дисперсии результативного признака:
R 2 =rxy 2 =
Значение R 2 указывает на то, что вариация результативного признака у на _______ % объясняется вариацией признак - фактора х.
б). Оценку качества полученного уравнения регрессии дает также средняя ошибка аппроксимации Ā.
Для того, чтобы вычислить Ā, произведем следующие расчеты:
подставим в уравнение регрессии фактические значения х и определим теоретические (расчетные) значения ŷх (заполняем 7-ой столбец таблицы 1);
найдем разности y - ŷxi (8-ой столбец таблицы 1) и величины А i = %(9-й столбец таблицы 1).
Теперь находим
Ā = Σ Ai / n =
Как видим, в среднем расчетные значения отклоняются от фактических на __________%, что
_______________________________________________________________________________.
в) Оценим качество уравнения регрессии с помощью F -теста. F -тест состоит в проверке гипотезы Н0 о статистической незначимости уравнения регрессии и показателя тесноты связи. Для этого выполняется сравнение фактического Fфакт и критического (табличного) Fтабл значений F -критерия Фишера. Fфакт определяется из соотношения значений факторной и остаточной дисперсий, рассчитанных на одну степень свободы.
Рассчитаем фактическое значение F -критерия Фишера:
Fфакт =
Здесь n – число единиц совокупности; m – число параметров при переменных х.
В данной задаче получили Fтабл Fфакт , что указывает на необходимость принять (отвергнуть) гипотезу Н0 о случайной природе выявленной зависимости и статистической незначимости параметров уравнения регрессии и показателя тесноты связи.
Дата добавления: 2021-03-18; просмотров: 47; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!