Построение степенной регрессии.

ЗАДАНИЕ 2. ПОСТРОЕНИЕ ПАРНОЙ РЕГРЕССИОННОЙ МОДЕЛИ

 

Цель работы: Оценить качество парной линейной ( ) и степенной регрессий. Выбрать наилучшую модель для дальнейшего эконометрического анализа.

 

Оценка качества модели осуществляется по следующим показателям:

1. коэффициент детерминации ;

2. средняя ошибка аппроксимации

3. F- критерий Фишера.

 

Качество модели считается высоким, если выполняются все три условия:

1. коэффициент детерминации ;

2. средняя ошибка аппроксимации ;

3. Fтабл < Fфакт.

Если хоть одно из условий не выполняется, качество модели низкое.

 

Выбор наилучшего варианта эконометрической модели осуществляется сравнением их качественных характеристик (показателей). Соответственно лучшему варианту модели должны соответствовать лучшие характеристики.

 

Построение парной линейной регрессии.

 

Указания к выполнению лабораторной работы.

 

1) Создайте и сохраните на своем диске Z новый файл MS Excel.

2) Запишите тему, цель работы и вид регрессионной модели (уравнение).

3) Вставьте в него таблицу исходных данных (вместе с номером варианта), скопировав ее в файле «Задания к ЛР» (у каждого студента свой вариант заданий, который присваивает ему преподаватель на практическом занятии. Пример на стр. 2, таблица 1).

4) Выполните расчеты коэффициентов а и в уравнения регрессии, используя регрессионный анализ (методика приведена на стр. 2).

5) Выполните расчет  по уравнению линейной регрессии  , пристроив дополнительный столбец к таблице исходных данных (см. пример таблица 1.

6) Рассчитайте среднюю ошибку аппроксимации (см. пример таблицы 2).

7) Сделайте вывод по показателям:

· коэффициент корреляции  – о тесноте и характере связи;

· коэффициент детерминации  – о влиянии изменения результата «у» при изменении факторной переменной «х»;

· средняя ошибка аппроксимации  – о величине ошибки регрессии;

· F - критерий Фишера – о значимости и надежности оцениваемых характеристик (о принятии или отвержении гипотезы Н0).

 

 

Рассмотрим пример расчета и анализа следующих исходных данных.

 

Таблица 1

Продажа макаронных изделий (за год)

 

  Y Х
Территории потребителей Продано в год, т. р. Заказано в год, т.р.
Свердловская область 475,5 502
Республика Бурятия 2100,3 2022,2
Красноярский край 3188,4 3012,2
Омская область 1038 1053,3
 Алтайский край 2199,8 2100,1
Кемеровская область 20981 19034,5
Новосибирская область 46104,3 38321,1
Томская область 2503,8 2202,2

 

1) Определим, где в таблице исходных данных зависимая переменная «у», а где независимая (объясняющая) переменная «х» (т.е. что от чего зависит: объем продаж от объема заказов (изначально) или наоборот).

Обозначим: Y – продано товаров за год, т. р., Х – заказано в соответствии с договорами за год, т.р.

 

2) Введем обозначения переменных над шапкой таблицы исходных данных и выделите эти ячейки яркой заливкой (см. пример таблицы 2.1).

 

3) Находим параметры  а и в. Для этого на вкладке «Данные» программы Excel  щелкнуть в «Анализ данных → Регрессия» (Настройка Анализа данных: нажать Файл Параметры  слева в диалоговом окне щелкнуть в Надстройки  справа в окне «Пакет анализа»  далее внизу кнопку Перейти  активировать(отметить галочкой) «Пакет анализа». Справа, в верхнем углу, на панели инструментов вкладки ДАННЫЕ появится функция Анализ данных).

В раскрывшемся диалоговом окне вводим:

® «Входной интервал Y» - щелкнуть курсор в окно напротив «входной интервал  Y» и выделить весь столбец числовых значений результативного показателя (у);

® «Входной интервал Х» - щелкнуть курсор в окно напротив «входной интервал  Х» и выделить весь столбец числовых значений факторного показателя (х);

® «Выходной интервал» - щелкнуть курсор в окно напротив «выходной интервал» и выделить одну пустую ячейку слева под таблицей исходных данных (см. пример рис. 1.)

® Нажать ОК.

 

Под таблицей исходных данных появится «ВЫВОД ИТОГОВ» - таблицы с показателями, рассчитанные в ходе выполнения регрессионного анализа.

 

«ВЫВОД ИТОГОВ» содержит 3 таблицы:

1. «Регрессионная статистика»:

· множественный R – коэффициент корреляции R;

· R–квадрат – коэффициент детерминации R2;

· нормированный R – нормированное значение коэффициента корреляции;

· стандартная ошибка – стандартное отклонение остатков;

· наблюдения – число исходных наблюдений (объем выборки).

 

2. Показатели таблицы «Дисперсионный анализ»:

· столбец «F» – расчетное значение F-критерия Фишера (это Fфакт);

· столбец «Значимость F» – значение уровня значимости, соответствующее вычисленному значению Fр.

 

3. Показатели таблицы 3:

· ячейка на пересечении столбца «Коэффициенты» и строки «Y - пересечение» – значение параметра уравнения линейной регрессии а - «отрезок».

· ячейка на пересечении столбца «Коэффициенты» и строки «Переменная Х1» – значение параметра уравнения линейной регрессии b – наклон.

 

 

Для нашего примера «вывод итогов» будет выглядеть следующим образом:


Y

X

Территории

Продано, т.р.

Заказано, т.р.

y^=a+b*x

(y-y^)/y

|(y-y^)/y|

Свердловская область

475,5

502

289,431216

0,391312

0,3913118

Республика Бурятия

2100,3

2022,2

2103,45947

-0,0015

0,0015043

Красноярский край

3188,4

3012,2

3284,80927

-0,03024

0,0302375

Омская область

1038

1053,3

947,28793

0,087391

0,0873912

 Алтайский край

2199,8

2100,1

2196,41619

0,001538

0,0015382

Кемеровская область

20981

19034,5

22403,9416

-0,06782

0,0678205

Новосибирская область

46104,3

38321,1

45418,3064

0,014879

0,0148792

Томская область

2503,8

2202,2

2318,25034

0,074107

0,0741072

Якутия

1780

1544

1532,83172

0,138859

0,1388586

Читинская область

851

869

727,365941

0,145281

0,1452809

0,9529295

Аср.=

9,5292947

ВЫВОД ИТОГОВ

Регрессионная статистика

Множественный R (rху)

0,999313564

коэффициент корреляции

R-квадрат ,

0,998627599

коэффициент детерминации

Нормированный R-квадрат

0,998456049

Стандартная ошибка

576,4462962

Наблюдения

10

объем выборки

F (табл)

5,25

Дисперсионный анализ

критерий Фишера

df

SS

MS

F (факт)

Значимость F

Регрессия

1

1934328998

1934328998

5821,202

9,706E-13

Остаток

8

2658322,659

332290,332

 

Итого

9

1936987321

 

 

 

Коэффициенты

Станд. ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Нижние 95,0%

Верхние 95,0%

Y-пересечение  (коэф-нт a)

-309,596665

213,1717852

-1,4523342

0,184474

-801,1717

181,9784

-801,172

181,9784

Переменная X  (коэф-нт b)

1,193282631

0,015640009

76,2967991

9,71E-13

1,1572167

1,229349

1,157217

1,229349

                               

Рис. 1. Пример оформления лабораторной работы


Как показано в примере на рисунке 1, выделите и подпишите в выводах итогах регрессии все необходимые показатели: коэффициенты корреляции rху и детерминации , F-критерий Фишера, коэффициенты регрессии а и в.

После того как найдены коэффициенты а и в, рассчитываем функцию линейной регрессии ̂ . Для этого к исходной таблице 1 добавляем столбец ̂  , (таблица 2).

 

 

Таблица 2

Y

X

Территории потребителей

Продано, т.р.

Заказано, т.р.

y^=a+b*x

(y-y^)/y

|(y-y^)/y|

Свердловская область

475,5

502

=а(F4)+b(F4)*гр.3

0,391312

0,3913118

Республика Бурятия

2100,3

2022,2

2103,45947

-0,0015

0,0015043

Красноярский край

3188,4

3012,2

3284,80927

-0,03024

0,0302375

Омская область

1038

1053,3

947,28793

0,087391

0,0873912

 Алтайский край

2199,8

2100,1

2196,41619

0,001538

0,0015382

Кемеровская область

20981

19034,5

22403,9416

-0,06782

0,0678205

Новосибирская область

46104,3

38321,1

45418,3064

0,014879

0,0148792

Томская область

2503,8

2202,2

2318,25034

0,074107

0,0741072

Якутия

1780

1544

1532,83172

0,138859

0,1388586

Читинская область

851

869

727,365941

0,145281

0,1452809

0,9529295

Аср.=

9,5292947

 

Для расчета величины  у^  необходимо выполнить следующее:

1. поставить курсор в ячейку, выделенную желтым цветом;

2. ввести формулу:

= абсолютный адрес коэффициента (а) ( F 4) + абсолютный адрес
коэффициента (в)( F 4) * относительный адрес значения x i  
(Заказано, т.р.) по Свердловской области.

Для того чтобы адрес ячейки не смещался при протягивании формулы, нужно во время записи формулы ввести абсолютный адрес этой ячейки, т.е. при ссылке на адрес ячейки, где стоит коэффициент а и в вводится символ доллара (например, $ D $11). Для этого достаточно нажать клавишу F 4, после введения в строку формулы адреса соответствующей ячейки:

 

= адрес ячейки «коэффициент (а)»  (нажать F 4 ) + адрес ячейки «коэффициент (в)» (нажать F 4 ) * адрес ячейки x i  (Заказано) по Свердловской области.

 

3. после ввода  формулы  нажать клавишу  E nt er  и  захватив  мышью правый нижний угол ячейки, протянуть ее на 9 строчек вниз.

Таким образом, функция линейной регрессии рассчитана.

Далее рассчитываем среднюю ошибку аппроксимации по формуле:

 

 

Расчет выполним также с помощью дополнительных вспомогательных расчетных столбцов (см. табл. 3 графа 5,6)

 

Таблица 3

 

Y

X

 

1

2

3

4

5

6

 
Территории потребителей

Продано, т.р.

Заказано, т.р.

y^=a+b*x

(y-y^)/y

|(y-y^)/y|

 

Свердловская область

475,5

502

=а(F4)+b(F4)*гр.3

=(гр.2-гр.4)/гр.2

=АВS (гр.5)

 

Республика Бурятия

2100,3

2022,2

2103,45947

-0,0015

0,0015043

 

Красноярский край

3188,4

3012,2

3284,80927

-0,03024

0,0302375

 

Омская область

1038

1053,3

947,28793

0,087391

0,0873912

 

 Алтайский край

2199,8

2100,1

2196,41619

0,001538

0,0015382

 

Кемеровская область

20981

19034,5

22403,9416

-0,06782

0,0678205

 

Новосибирская область

46104,3

38321,1

45418,3064

0,014879

0,0148792

 

Томская область

2503,8

2202,2

2318,25034

0,074107

0,0741072

 

Якутия

1780

1544

1532,83172

0,138859

0,1388586

 

Читинская область

851

869

727,365941

0,145281

0,1452809

 

 

0,9529295

=S гр.6

 

9,5292947

= Аср.

Для расчета графы 5 ((y-y^)/y) таблицы 3 необходимо:

 

1. поставить курсор в пустую ячейку, выделенную желтым цветом;

 

2.ввести формулу:  

=  (относительный  адрес значения  «у» по Свердловской  области  –  относительный  адрес  значения «у^»  по Свердловской области) / относительный адрес значения «у» по Свердловской области.

 

3. после ввода  формулы  нажать клавишу  E nt er  и  захватив  мышью правый нижний угол ячейки, протянуть ее на 9 строчек вниз.

 

 

Для расчета графы 6 (|(y-y^)/y|) таблицы 3необходимо:

 

1. поставить курсор в ячейку, выделенную оранжевым цветом;


2. На панели инструментов щелкнуть в кнопку f ( x ). В появившемся диалоговом окне выбрать Категорию «Математические» ® функция «ABS» ®ОК® в ыделить значение графы 5 ((y-y^)/y) по Свердловской области ® ОК.

3. После ввода формулы захватив мышью правый нижний угол ячейки и протянуть ее на 9 строчек вниз.

4. Находим сумму графы |(y-y^)/y|(т.е. автосумму графы 6) в ячейке сиреневого цвета (см.табл.3) под этим столбцом.

5. Рассчитываем Аср. по формуле стр.7. Ставим курсор в ячейку ниже автосуммы (гр.6) и записываем формулу:

= щелкаем в ячейку с автосуммой/ 10*100

6. Делаем выводы о качестве модели по показателям:

1.  коэффициент корреляции;

2.  коэффициент детерминации;

3.  средняя ошибка аппроксимации;

4.  F-критерий Фишера.

 

7. Сделаем общий вывод о качестве построенной линейной модели (см. стр.1)

Построение степенной регрессии.

Цель данной работы аналогичная, что для парной линейной регрессии: оценить качество модели (см. стр.1).

1) Запишите тему, цель работы и вид степенной регрессии .

2) Для построения степенной регрессии используются те же исходные данные, что и при построении линейной регрессии. Скопируйте их и вставьте на новый рабочий лист.

 

Так как цель аналогична предыдущей работе, значит и последовательность выполнения расчетов будет аналогична.

Отличительной особенностью будет расчет регрессионного анализа, в который берутся не исходные данные У и Х, а прологарифмированные значения этих переменных (см.таблицу4). Так как регрессионный анализ строится только для линейных функций, мы степенную регрессию должны привести к линейному виду (через функцию LN), а затем рассчитать параметры уравнения регрессии а и в.

Для этого к таблице исходных данных (таблица 1), которую скопировали на новый рабочий лист, необходимо добавить два столбца (таблица 4 графа 4,5).

 

Таблица 4

Y

X

 

 

1

2

3

4

5

6

7

8

Территории потребителей

Продано, т.р.

Заказано, т.р.

LN Y

LN X

y^=a*x^b

(y-y^)/y

|(y-y^)/y|

Свердловская обл.

475,5

502

=LN(y)

 

=LN(x)

 

496,5352

-0,04424

0,04423

Республика Бурятия

2100,3

2022,2

7,6498

7,61194

2124,595

-0,01157

0,01156

Красноярский край

3188,4

3012,2

8,06727

8,01042

3219,812

-0,00985

0,00985

Омская область

1038

1053,3

6,94505

6,95968

1075,812

-0,03643

0,03642

 Алтайский край

2199,8

2100,1

7,69612

7,64974

2210,055

-0,00466

0,00466

Кемеровская обл.

20981

19034,5

9,95137

9,85400

22037,49

-0,05035

0,05035

Новосибирская обл.

46104,3

38321,1

10,7386

10,5537

45731,91

0,00807

0,00807

Томская область

2503,8

2202,2

7,82556

7,69721

2322,269

0,07250

0,07250

Якутия

1780

1544

7,48436

7,34213

1603,337

0,09924

0,09924

Читинская область

851

869

6,74641

6,76734

880,2109

-0,03433

0,03432

0,37125

Аср.=

3,71255

Для заполнения колонок LN Y и LN X необходимо поставить курсор в первую ячейку столбца LN Y (синяя заливка)и на вкладке «Формулы» вызвать “Вставить функцию ® Категория: Математические ® функция: LN” и выделить значение Y (продано) по Свердловской области и нажать «ОК». После ввода формулы захватив мышью правый нижний угол ячейки, протянуть ее на 9 строчек вниз, а затем на одну колонку вправо.

 

Теперь можно искать параметры а и b. Для этого выполняем следующее: Данные ®анализ данных →Регрессия.

 

В раскрывшемся диалоговом окне ввести толькод анные:

 

a) «В ходной интервал Y» - выделить весь диапазон числовых значений содержащихся в колонке LN Y;

b) «В ходной интервал Х» - выделить весь диапазон числовых значений содержащихся в колонке LN X;

c) «В ыходной интервал» - выделить одну пустую ячейку слева под таблицей исходных данных см. рис. 1стр.4

После нажатия кнопки «ОК» в диалоговом окне Регрессии под таблицей исходных данных появятся результаты регрессионного анализа, которые называются «Вывод итогов».

В появившихся таблицах также как и при построении линейной функции необходимо выделить заливкой и подписать: коэффициенты корреляции и детерминации, критерий Фишера, коэффициенты А и в.

Обратите внимание, что с помощью Регрессии вы нашли коэффициент

 

«А», а не «а». Следовательно, для того чтобы определить «а» необходимо поставить курсор в пустую ячейку рядом с «Выводом итогов» и на вкладке

«Формулы» вызвать “В ставить функцию ® Категория: Математические ®

 

функция: EXP” и выделить значение «А».

 

После того как найдены коэффициенты а и в, мы можем рассчитать функцию степенной регрессии у̂ = ахв. Для этого к таблице 4 необходимо добавить столбец (графа 6).

Для расчета графы 6необходимо выполнить следующие команды (как и в линейной регрессии):

 

1. поставить курсор в ячейку, выделенную желтым цветом;

 

2. ввести формулу: = абсолютный адрес коэффициента (а) * относительный адрес значения (х) заказано по Свердловской области ^ абсолютный адрес коэффициента (в)

Для того чтобы возвести число в степень, необходимо переключить клавиатуру на английский язык и нажать сочетание клавиш Shift – 6 и тогда у вас появится значок (^), означающий возведение в степень.

3. после ввода  формулы  нажать клавишу  E nt er  и  захватив  мышью правый нижний угол ячейки, протянуть ее на 9 строчек вниз.

Далее также как и при построении линейной модели, необходимо рассчитать  среднюю  ошибку аппроксимации (пристраиваем графы 7 и 8 таблица 4) и  оценить  качество построенной степенной модели, придерживаясь указаний изложенных выше и в лекционной материале. Работа  должна  завершиться  написанием  вывода  по  степенной  модели,  а также необходимо сравнить линейную и степенную модель и сделать вывод о том какая модель подходит для ваших данных больше.

 


Для того чтобы рассчитать колонку у = а*х^в необходимо:

 

1. поставить курсор в ячейку, выделенную желтым цветом;

 

2. ввести формулу: = абсолютный адрес коэффициента (а) * относительный адрес значения (х) заказано по Свердловской области ^ абсолютный адрес коэффициента (в)

Для того чтобы возвести число в степень, необходимо переключить клавиатуру на английский язык и нажать сочетание клавиш Shift – 6 и тогда у вас появится значок (^), означающий возведение в степень.

3. после ввода  формулы  нажать клавишу  Enter  и  захватив  мышью правый нижний угол ячейки, протянуть ее на 9 строчек вниз.

Далее также как и при построении линейной модели, необходимо рассчитать  среднюю  ошибку аппроксимации  и  оценить  качество построенной степенной модели, придерживаясь указаний изложенных выше. Работа  должна  завершиться  написанием  вывода  по  степенной  модели,  а также необходимо сравнить линейную и степенную модель и сделать вывод о том какая модель подходит для ваших данных больше.

 


Дата добавления: 2021-01-20; просмотров: 63; Мы поможем в написании вашей работы!

Поделиться с друзьями:




Мы поможем в написании ваших работ!