Проверка гипотезы о линейности



Если r2ху и R2ху равны, или их разность меньше, чем 0,1, то нет смысла усложнять работу и можно использовать линейную функцию.

Оценку надежности проводят с помощью критерия Стьюдента

Если tф > tтабл, то различие R2 и r2 существенны и замена функции на линейную невозможна.

Пример: По 7 территориям Уральского региона известны следующие данные

Расх. на

 покупку

 продовол.

 т-ров,%

Ср.днев.з/п

 1 раб.,руб.

У = lg y

Х = lg х

У ∙Х

Х^2

Ух

у - Ух

(у-Ух)^2

х∙у

(х - хср.)^2

1

68,8

45,1

1,8376

1,6542

3,0397

2,7363

61

7,8

60,8

3102,9

96,0

2

61,2

59

1,7868

1,7709

3,1641

3,1359

56,3

4,9

24,0

3610,8

16,8

3

59,9

57,2

1,7774

1,7574

3,1236

3,0884

56,8

3,1

9,6

3426,3

5,3

4

56,7

61,8

1,7536

1,7910

3,1406

3,2076

55,5

1,2

1,4

3504,1

47,6

5

55

58,8

1,7404

1,7694

3,0794

3,1307

56,3

-1,3

1,7

3234,0

15,2

6

54,3

47,2

1,7348

1,6739

2,9040

2,8021

60,2

-5,9

34,8

2563,0

59,3

7

49,3

55,2

1,6928

1,7419

2,9488

3,0344

57,4

-8,1

65,6

2721,4

0,1

 

405,2

384,3

12,3234

12,1587

21,4002

21,1354

403,5

1,7

198,0

22162,3

240,3

 

Задание: 1) построить степенную функцию, рассчитать её параметры;

           2) оценить с помощью критерия Фишера надежность модели и проверить гипотезу о линейности;

           3) рассчитать коэффициенты эластичности; проверить гипотезу о линейности.

 

Степенная модель имеет вид: у = а ∙ хв

                                                lgy= lga + b ∙ lgx

                                                У = lgy; A = lga; X = lgx

                                                У = A + bx

У = 2,278 – 0,298 ∙ х

у = 102,278 ∙ х-0,298 = 189,7 ∙ х-0,298

Рассчитаем критерий Фишера:

Доля объясненной дисперсии составляет 14%.

Fтабл = 6,61

Fфакт < Fтабл => с вероятностью 95% уравнение статистически не значимо. Это означает, что а и b получены случайным образом, и по такому уравнению нельзя делать прогноз.

                


Тема 8. Множественная регрессия

1

Спецификация модели

Парная регрессия дает хороший результат, если выявлен Олин фактор, очень сильно влияющий на результат, а влиянием всех остальных факторов можно пренебречь.

Такие зависимости характерны для химических, физических и биологических исследований, когда существует возможность постановки эксперимента.

Поставить эксперимент – организовать среду, когда все остальные факторы, кроме одного, будут зафиксированы на одном уровне.

В экономике такие зависимости встречаются редко, и отсутствует возможность проведения эксперимента. Поэтому для экономики характерны многофакторные зависимости.

Спецификация модели заключается в решении двух вопросов:

1) отбор факторов из множества существующих у = f (х1, х2, …, хn)

                                                                                у = f (xi, xi+1, …, xk), где k < n

2) выбор вида уравнения регрессии

2

Отбор факторов при построении уравнения множественной регрессии

Факторы должны удовлетворять условиям:

1. Они должны быть количественно измеримы.

Если факторы качественные, нужно придать им количественную оценку ( например, проранжировать, присвоить рейтинг, т.п.).

2. Факторы не должны быть взаимозависимыми (интеркоррелированными), т.е. факторы не должны быть в функциональной связи между собой.

Если факторы интеркоррелированны, то невозможно определить их индивидуальное влияние на результат. Т.о. параметры уравнения невозможно интерпретировать.

3. Факторы должны объяснять корреляцию независимой переменной (результат), т.е. каждый следующий фактор, включенный в модель, должен увеличивать r2.

Т.е. при включении дополнительного фактора r2 должно возрастать существенно.

Существенно – если изменяется первый или второй знак после запятой.

                     R2n = 0,852

                     R2n+1 = 0,903 (нужно включить)

                     R2n+2 = 0,904 (несущественное изменение) (не нужно включать)

Если в модели есть «лишние» факторы, то модель может стать статистически не значимой.

Т.о. отбор факторов проводится в два этапа:

1) подбирают факторы исходя из существенности проблемы;

2) отбирают факторы по какому-нибудь алгоритму.


Тема 9. Мультиколлинеарность

Считают, что факторы коллинеарны, если rxixj ≥ 0,7, т.е факторы хi и xj  тесно связаны между собой и находятся в линейной зависимости => хi и xj друг друга дублируют и один из них рекомендуется исключить из регрессии.

Оставляют в уравнении фактор, имеющий: 1) тесную связь с результатом;

                                                                      2) наименьшую тесноту связи с другими факторами.

Для оценки мультиколлинеарности нужно построить матрицу парных линейных коэффициентов корреляции:

MS Excel: Сервис → Анализ данных → Корреляция → Выбор диапазона

В результате выходит таблица

  у х1 х2 х3
у 1      
х1 0,8 1    
х2 0,7 0,8 1  
х3 0,6 0,5 0,2 1

 

Rx1x2 = 0,8 > 0,7 => х1 и x2 коллинеарны.

у = f (х2, х3) фактор х3 наиболее независим в данной системе, т.к. его линейные коэффициенты корреляции наименьшие (0,2).

Существуют случаи, когда нужно включить в модель факторы, имеющие сильную связь между собой, тогда используют следующие подходы для преодоления сильной межфакторной корреляции:

1. Исключение факторов;

2. Преобразование факторов, чтобы уменьшить корреляцию между ними:

                        А) переход к первым разностям

                            х1; х2; х3

                            х2 → х2 - х1; х3 → х3 – х2 и т.д.

Каждый уровень ряда заменяем на абсолютный прирост, соответствующий этому уровню. Используется в рядах динамики.

 

Б) метод главных компонент

Переход от исходных переменных к их линейным комбинациям.

3. Совмещенное уравнение регрессии

Отражает не только зависимость результата от фактора, но и совместное влияние факторов на результат.

у = f (х1, х2, х3)

ух = а+в1х12х23х312х1∙х2+ в13х1∙х3+ в23х2∙х3123 х1∙х2∙х3

Ограничения для каждого параметра при х – нужно 6-7 измерений. Для данного уравнения нужно 42-49 измерений, что не всегда доступно.

4. Переход к уравнениям приведенной формы

Выражаем фактор из другого уравнения и подставляем в исходное уравнение.


Тема 10. Выбор формы уравнения регрессии

1) Линейная функция  y = a + b1x1 + b2x2 + b3x3 + … + bnxn

«+»: - сравнительно просто отыскать параметры уравнения;

   - сравнительно просто интерпретировать.

Результат увеличивается на величину b1 при изменении фактора х1 на единицу и всех остальных факторов, зафиксированных на среднем уровне.

2) Степенная функция y = a ∙ x1b1 ∙ x2b2 ∙ … ∙ xnbn

Интерпретация: b1, b2, bn - коэффициенты эластичности. Показывают, на сколько изменился результат в среднем при изменении соответствующего фактора на 1 %.

Другие функции используются редко.

 


Тема 11. Оценка параметров уравнения множественной регрессии

1

Отыскание параметров уравнения

Параметры уравнения множественной регрессии оцениваются МНК.

Для отыскания параметров сроится система нормальных уравнений.

y = a + b1x1 + b2x2 + b3x3 + … + bnxn

Тогда система нормальных уравнений принимает следующий вид:

∑y = na + b1∑x1 + b2∑x2 + b3∑x3 + … + bn∑xn

∑y ∙ x1 = a∑x1 + b1∑x12 + b2∑x1∙ x2 + b3∑ x1∙x3 + … + bn∑ x1∙xn

∑y ∙ x2 = a∑x2 + b1∑x1∙ x2 + b2∑x22 + b3∑ x2∙x3 + … + bn∑ x2∙xn

∑y ∙ xn = a∑xn + b1∑x1∙ xn + b2∑x2∙ xn + b3∑ x2∙x3 + … + bn∑xn2

Эту систему можно записать в следующем виде:

А = (a; b1; b2; bn)

 

Х = А ∙ У                                   А = У ∙ Х-1

Если функция степенная, или другая нелинейная, то её сначала линеализуют, а затем применяют МНК.


Тема 12. Частные уравнения регрессии

Есть линейное уравнение вида y = a + b1x1 + b2x2 + b3x3 + … + bnxn, то можно найти частное уравнение регрессии вида

Эти уравнения регрессии показывают связь между результатом и соответствующим фактором при закреплении других слагаемых на среднем уровне, т.е. позволяют точно оценить влияние фактора на результат.

Эти уравнения позволяют определить частные коэффициенты эластичности, которые показывают, на сколько процентов изменился результат под воздействием одного фактора изолированно в процентах.

Коэффициенты эластичности определяются точно также как для уравнения парной линейной регрессии:


Тема 13. Множественная корреляция

После отыскания параметров уравнение множественной регрессии нужно проверить на статистическую значимость и надежность.

Для этого используются: 1) Индекс множественной корреляции

                                       2) Частные коэффициенты корреляции

                                       3) F – критерий Фишера

                                       4) t – статистика

1) Индекс множественной корреляции   R

σ2у – общая дисперсия результативного признака;

σ2ост – остаточная дисперсия для уравнения.

Этот индекс показывает, на сколько тесная связь между факторами и результатом.

Если модель построена правильно, то индекс множественной корреляции существенно отличается от максимального индекса парной корреляции.

Rx1x2…xn > max (rxy)

Индекс линейной корреляции может служить индикатором необходимости включения в модель дополнительного признака.

Если при включении дополнительного признака изменяется второй знак, то включение этого признака оправдано.

R2х1,х2,…,хn показывает процент объясненной регрессии с помощью данного уравнения.

2) Частные коэффициенты корреляции – это коэффициенты линейной корреляции, характеризующие тесноту связи между результатом и соответствующим фактором при устранении влияния всех других факторов, входящих в уравнение.

R2 в числителе = R2 всего уравнения

R2 в знаменателе = коэффициент детерминации при исключении фактора Хi

Порядок расчета: 1. Составляется матрица парных коэффициентов корреляции;

                             2. Находятся частные коэффициенты корреляции первого порядка (частные коэффициенты корреляции между У и двумя другими факторами).

х1 и х2:

х1, х2, х3: ryx1x2   ryx2x3              ryx1x3

Далее проводим анализ, включение какого фактора оказывает сильное влияние на результат.

3) Критерий Фишера

 Дфактор – факторная сумма квадратов, деленная на одну степень свободы.

Дост – остаточная сумма квадратов, деленная на одну степень свободы.

k – количество факторов или независимых переменных.

Коэффициент Фишера показывает значимость уравнения регрессии.

Если Fфакт > Fтабл – то уравнение регрессии статистически значимо.

4) t – статистика рассчитывается стандартным образом, и показывает статистическую значимость того или иного параметра.

 


Тема 14. Фиктивные переменные во множественной регрессии

Задача: Включить в модель качественный признак.

y = f (х1; х2)

y – частота потребления кофе;

х1 – личный доход;

х2 – пол.

х2 – переменная качественная, её нужно заменить на количественную. Для этого введем фиктивную переменную z.

Количество фиктивных переменных z должно соответствовать количеству значений, принимаемых признаком.

х2 → z:

        

Составим уравнение: у = a + b1x1 + c1z1 + c2z2 + ε и решаем его стандартным способом (МНК).

Интерпретация уравнения регрессии: коэффициент при х1 имеет стандартную интерпретацию, коэффициенты при z1 и z2 нужны для составления частных уравнений регрессии.

В данном случае интерпретации подлежат частные коэффициенты корреляции.

Разность между коэффициентами при фиктивных переменных показывает относительное влияние качественного признака.

 


Дата добавления: 2022-01-22; просмотров: 29; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!