Статистические оценки взаимосвязи двух временных рядов



Изучение причинно-следственных зависимостей переменных, представленных в виде временных рядов, является сложной задачей эконометрического моделирования. Каждый уровень временного ряда, в общем случае, может описываться следующей моделью (1):

 

                                      Yt = Ut + Vt + et ,                                       

где Ut - трендовая компонента;

Vt – сезонная компонента;

et – случайная компонента.

t – уровни наблюдения, t=1, 2, 3,….

 

Наличие этих компонент может привести к серьезным проблемам при проведении корреляционно-регрессионного анализа данных временных рядов.

Поэтому на предварительном этапе анализа необходимо выявить структуру изучаемых временных рядов. Для этого необходимо построить совмещенные графики анализируемых рядов и провести визуальный анализ. И если в одном из временных рядов (результатная переменная) тенденция изменения может быть следствием того, что другая переменная (факторная) то же содержит такую же тенденцию или противоположную направленность, то это может быть причиной наличия коинтеграции временных рядов данных.

Под коинтеграцией понимается причинно следственная зависимость в уровнях двух или более временных рядов, которая выражается в совпадении или противоположной направленности их тенденций и случайной колеблемости.

Пример 2. Оценить тесноту связи временных рядов среднедушевого располагаемого дохода x(t) и среднедушевого расхода на конечное потребление y(t) в США в период с 1960 по 1991 годы. Исходные данные для расчетов даны в таблице 3 [1].

                                                                                Таблица 3

Годы, t

y(t)

x(t)

(t)

e(t)

Δe(t)

y*(t)

x*(t)

1

2

3

4

5

6

7

8

1

6698

7264

6524,16

173,836

2

6740

7382

6632,98

107,023

-66,813

1780,131

2003,008

3

6931

7583

6818,33

112,672

5,649

1940,03

2116,629

4

7089

7718

6942,82

146,182

33,51

1956,595

2102,789

5

7384

8140

7331,96

52,0365

-94,1455

2134,596

2424,821

6

7703

8508

7671,31

31,6868

-20,3497

2235,148

2480,33

7

8005

8822

7960,87

44,1329

12,4461

2300,929

2521,826

8

8163

9114

8230,13

-67,1337

-111,267

2235,298

2581,309

9

8506

9399

8492,95

13,0547

80,1884

2461,299

2650,083

10

8737

9606

8683,83

53,1705

40,1158

2438,307

2646,041

11

8842

9875

8931,89

-89,8868

-143,057

2372,252

2761,757

12

9022

10111

9149,51

-127,513

-37,6262

2474,499

2798,563

13

9425

10414

9428,92

-3,9235

123,5895

2744,209

2926,805

14

9752

11013

9981,29

-229,289

-225,366

2772,788

3301,433

15

9602

10832

9814,38

-212,381

16,908

2380,644

2676,874

16

9711

10906

9882,62

-171,619

40,762

2600,719

2884,904

17

10121

11192

10146,4

-25,3531

146,2659

2930,005

3116,107

18

10425

11406

10343,7

81,3077

106,6608

2930,4

3118,324

19

10744

11851

10754

-10,0473

-91,355

3024,288

3404,857

20

10867

12039

10927,4

-60,4107

-50,3634

2911,068

3263,335

21

10746

12005

10896,1

-150,058

-89,6473

2698,987

3090,121

22

10770

12156

11035,3

-265,302

-115,244

2812,587

3266,298

23

10782

12146

11026,1

-244,08

21,222

2806,815

3144,482

24

11179

12349

11213,3

-34,276

209,804

3194,929

3354,887

25

11617

13029

11840,3

-223,335

-189,059

3338,951

3884,566

26

12015

13258

12051,5

-36,5067

186,8283

3412,612

3610,026

27

12336

13552

12322,6

13,3823

49,889

3438,893

3734,451

28

12568

13545

12316,2

251,837

238,4547

3433,192

3509,744

29

12903

13890

12634,3

268,697

16,86

3596,396

3859,928

30

13027

14030

12763,4

263,597

-5,1

3472,329

3744,455

31

13051

14154

12877,7

173,25

-90,347

3404,507

3764,785

32

12889

13987

12723,8

165,249

-8,001

3224,735

3505,963

 

На рисунке 6 приведены графики изменения во времени среднедушевого располагаемого дохода x(t) и среднедушевого расхода на конечное потребление y(t) в США в период с 1960 по 1991 г.

Рисунок 6. Взаимосвязи временных рядов среднедушевого располагаемого дохода x(t) и среднедушевого расхода на конечное

 потребление y(t) (долл. США).

 

Визуальный анализ показывает, что тенденции этих временных рядов совпадают. Для проверки гипотезы наличия коинтеграции между этими рядами построим регрессионную зависимость y=f(x) с помощью программы STATGRAPHICS Plus:

 

Multiple Regression Analysis

-----------------------------------------------------------------------------

Dependent variable: y(t)

-----------------------------------------------------------------------------

                                                        Standard T

Parameter      Estimate     Error  Statistic   P-Value

-----------------------------------------------------------------------------

CONSTANT      -174,3         143,65        -1,21          0,23

X(t)                       0,92        0,0128    71,78     0,0000

-----------------------------------------------------------------------------

                         

 

 

 Analysis of Variance

-----------------------------------------------------------------------------

Source Sum of Squares Df Mean Square F-Ratio P-Value

-----------------------------------------------------------------------------

Model         1,23E8           1     1,23E8       5152,96   0,0000

Residual     718861,0   30     23962,0

-----------------------------------------------------------------------------

Total (Corr.)      1,24E8 31

R-squared = 99,42 percent

R-squared (adjusted for d.f.) = 99,40 percent

Standard Error of Est. = 154,8

Mean absolute error = 121,945

Durbin-Watson statistic = 0,519

 

Уравнение регрессии имеет вид:

                              y(t) = -174,3 + 0,92x(t).                                   (9)

 

Для проверки гипотезуы отсутствия коинтеграции между рядами воспользуемся критерием Энгеля-Грангера [2]. Для этого рассчитаем уравнение регрессии вида:

                                           Δe(t)=f(e(t-1)),                                  (10)

где e(t-1), t=2, 3,..32 – остаток регрессионной модели (9);

Δe(t), t=2, 3,..32 – первые разности остатков.

 

Параметры уравнения регрессии (10), рассчитанные с помощью программы STATGRAPHICS Plus приведены ниже:

 

Multiple Regression Analysis

-----------------------------------------------------------------------------

Dependent variable: Δe(t)

-----------------------------------------------------------------------------

                                                      Standard T

Parameter          Estimate    Error  Statistic      P-Value

-----------------------------------------------------------------------------

CONSTANT            -1,73       18,94      -0,091       0,93

e (t-1)                     -0,27       0,127      -2,15         0,04

-----------------------------------------------------------------------------

                      Analysis of Variance

-----------------------------------------------------------------------------

Source Sum of Squares Df Mean Square F-Ratio P-Value

-----------------------------------------------------------------------------

Model                51265,8 1 51265,8  4,62  0,04

Residual            322068,0 29 11105,8

-----------------------------------------------------------------------------

Total (Corr.)       373334,0 30

R-squared = 13,7 percent

R-squared (adjusted for d.f.) = 10,75 percent

Standard Error of Est. = 105,38

Mean absolute error = 82,83

Durbin-Watson statistic = 2,03

 

Уравнение регрессии имеет вид:

                 Δe(t)= -1,73 – 0,27e(t-1)                                     (11)                                     

 

Расчетное значение t-критерия значимости коэффициента регрессии при остатке e(t-1) по модулю равно 2,15, превышает критическое значение tкр=1,94, то с вероятностью 95% можно отклонить нуль гипотезу и сделать вывод о коинтеграции анализируемых временных рядов.

Коэффициент детерминации уравнения регрессии (9) равен 99,42%, что говорит о тесной прямой связи между расходами и среднедушевым доходом.

При расчете параметров уравнения регрессии (9) сталкиваемся с проблемой автокорреляции остатков модели. Наличие автокорреляции остатков проверяется по расчетной величине первого коэффициента автокорреляции r(1), который оказался больше критического значения, что свидетельствует о наличии положительной автокорреляции в остатках. Поэтому найденные оценки параметров уравнения регрессии (9) не являются эффективными ввиду нарушения предпосылок м.н.к.

Для получения новых оценок параметров уравнения регрессии воспользуемся обобщенным методом наименьших квадратов [2].

Найдем оценку коэффициента автокорреляции остатков первого порядка r1:

                                       r1 = 0,7405.                                         (12)

Проведем пересчет исходных данных x и y в соответствии с формулами:

                          x* (t)= x(t) - r1* x(t-1),

                          y* (t)= y(t) - r1* y(t-1).                                      (13)

 

Определим параметры уравнения регрессии y*=f(x*) обычным м.н.к.:

 

Multiple Regression Analysis

-----------------------------------------------------------------------------

Dependent variable: y* (t)

-----------------------------------------------------------------------------

                                                       Standard T

Parameter       Estimate    Error  Statistic     P-Value

-----------------------------------------------------------------------------

CONSTANT       -83,94      110,25 -0,76      0,45

x* (t)           0,93        0,035   26,2        0,0000

-----------------------------------------------------------------------------

                      Analysis of Variance

-----------------------------------------------------------------------------

Source   Sum of Squares Df Mean Square F-Ratio P-Value

-----------------------------------------------------------------------------

Model        7,59E6         1 7,594E6    686,30 0,0000

Residual    320894,0    29 11065,3

-----------------------------------------------------------------------------

Total (Corr.)      7,91E6 30

R-squared = 95,94 percent

R-squared (adjusted for d.f.) = 95,8 percent

Standard Error of Est. = 105,19

Mean absolute error = 82,0

Durbin-Watson statistic = 2,11

 

 

Уравнение регрессии с пересчитанными данными имеет вид:

                  y* (t) = -83,94 + 0,93 x* (t).                              (14)

 

Свободный коэффициент исходного уравнения регрессии вычисляется по формуле:

              a = a*/(1- r1) = -83,94/(1 – 0,74) = -322,85.       (15)

 

Уравнение регрессии с уточненными коэффициентами принимает вид:

                              y(t) = -322,85 + 0,93 x(t).                    (16)

 

Полученные результаты являются статистически значимыми. Склонность к потреблению в период с 1960 по 1991 г. была равна 0,93. Это означает, что с увеличением среднедушевого дохода на 1 долл. среднедушевые расходы возрастают в среднем на 0,93 долл.

Если в результате проведенного анализа будет обнаружено отсутствие коинтеграции между рядами, либо на предварительном анализе совмещенных графиков в структуре изучаемых временных рядов обнаруживается тренда либо циклические колебания, то перед проведением дальнейших исследований взаимозависимости необходимо устранить тренд и циклическую компоненту из уровней каждого ряда. Наличие этих компонент может привести к завышению истинных показателей тесноты связи изучаемых временных рядов, если оба ряда будут содержать циклические колебания одинаковой периодичности, либо к занижению - в случае если только один из рядов будет содержать циклическую составляющую или периодичности колебаний циклических составляющих будут различными.

Методика исключения трендовой составляющей и циклической компоненты рассмотрены выше.

Дальнейший анализ взаимосвязи рядов проводят с использованием не исходных уровней, а центрированных рядов, получаемых путем вычитания из исходного ряда, составляющих тренда и циклической компоненты. Содержательная интерпретация параметров модели, рассчитанной по центрированным рядам, затруднительна. Ее можно использовать только для прогнозирования.

Пример 3. Расходы на конечное потребление и совокупный доход в течение 8-и лет, в условных единицах, приведены в таблице 4.

 

                                                       Таблица 4

Год

Расходы на конечное потребление Совокупный доход

1

7

10

2

8

12

3

8

11

4

10

12

5

11

14

6

12

15

7

14

17

8

16

20

 

По табличным данным строим совмещенный график временных рядов (рисунок 7).

Рисунок 7. Взаимосвязи временных рядов расхода на конечное

потребление y(t) и совокупного дохода x(t)

 

На графике видно наличие тренда в анализируемых временных рядах. Корреляционно-регрессионный анализ, проведенный по исходным данным, дает следующие результаты:

        y(t) = -2,047 + 0,922 x(t), R2 =95,5% , r = 0,982.             (17)

 

Можно предположить, что полученные результаты (большое значение коэффициента парной корреляции r = 0,982) содержат ложную корреляцию, т.к. в каждом из рядов содержится трендовая компонента.

Выделим трендовые компоненты из исходных рядов. Как видно из графиков, тренд можно описать полиномом второго порядка.

Рисунок 8. Выделение тренда во временных рядах расхода

на конечное потребление и совокупного дохода.

Результаты построения модели регрессии по центрированным рядам приведены ниже:

                           y0 (t)= 0,0026 + 0,269 x0(t).                        (18)

 

Multiple Regression Analysis

-----------------------------------------------------------------------------

Dependent variable: y0(t)

-----------------------------------------------------------------------------

                                                  Standard      T

Parameter  Estimate    Error  Statistic   P-Value

-----------------------------------------------------------------------------

CONSTANT 0,0026      0,103      0,024       0,98

x0 (t)          0,269          0,188      1,43        0,20

-----------------------------------------------------------------------------

Analysis of Variance

-----------------------------------------------------------------------------

Source  Sum of Squares Df Mean Square F-Ratio P-Value

-----------------------------------------------------------------------------

Model               0,176           1          0,176     2,06  0,20

Residual            0,514        6            0,0857

-----------------------------------------------------------------------------

Total (Corr.)       0,69       7

R-squared = 25,52 percent

R-squared (adjusted for d.f.) = 13,10 percent

Standard Error of Est. = 0,29

Mean absolute error = 0,1767

Durbin-Watson statistic = 2,82

Регрессионная модель получилась не адекватной, т.к. расчетное значение критерия Фишера F=2,06 меньше табличного значения для уровня значимости 0,05, числа степеней свободы 1; 6 (F1;6 = 5,99). Коэффициент корреляции между центрированными рядами незначимый, равен r = 0,5.

Связь между временными рядами на конечное потребление и совокупным доходом отсутствует. Уточненный анализ дал противоположные результаты по сравнению с тем, который мог получиться при не учете тренда в исходных временных рядах.

Контрольные вопросы

 1. Модель аддитивного случайного процесса, интерпретация ее компонент.

2. Чем вызывается трендовая составляющая во временном ряду, ее аппроксимация?

3. Чем может вызываться периодическая составляющая во временном ряду, ее аппроксимация?

4. Как оценить случайную компоненту во временном ряду и чем она может вызываться?

5. Как оценивается точность разработанной модели временного ряда?

6. Для чего проверяют выполнение предпосылок м.н.к.?

7. Коинтеграции анализируемых временных рядов и чем она вызывается?

8. Обобщенным методом наименьших квадратов, в каких случаях он применяется?

9. Если обнаруживается тренд  либо циклические колебания в исходных данных, то что необходимо выполнить перед дальнейшим анализом взаимосвязи рядов?


Дата добавления: 2018-04-15; просмотров: 298; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!