Расчёт множественных коэффициентов корреляции

РЕАЛИЗАЦИЯ ЗАДАЧ МНОГОМЕРНОГО КОРРЕЛЯЦИОННОГО АНАЛИЗА

С ИСПОЛЬЗОВАНИЕМ ПАКЕТА MS EXCEL

Y3 - рентабельность;

X5 - удельный вес рабочих в составе ППП;

Х7 - коэффициент сменности оборудования;

Х10 -фондоотдача;

X15 - оборачиваемость нормируемых оборотных средств;

 

 

Проведение корреляционного анализа рассмотрим на примере.

С целью анализа взаимосвязи показателей эффективности производства продукции бы­ли рассмотрены параметры производственно-хозяйственной деятельности 30 предприятий машиностроения.

Необходимо провести анализ взаимосвязи следующих экономических показателей:

Результативный признак:

Y1 производительность труда

Факторные признаки:

Х10 - фондоотдача;

Х14 - фондовооруженность труда;

Х15 - оборачиваемость нормируемых оборотных средств;

X16 - оборачиваемость ненормируемых оборотных средств.

Исходные данные представлены в файле Коррел. анализ. xls.

Предположим, что рассматриваемые признаки Y1, Х10, Х14, Х15, X16 в генеральной совокупности подчиняются нормальному закону распределения, и указанные данные представляют выбор­ку из этой генеральной совокупности. Для решения данной задачи воспользуемся программным продуктом MS EXCEL.

1. Скопируйте в свою папку или на Рабочий стол файл Коррел. анализ. xls с диска U:\Общая информация\Эконометрика;

2. Откройте файл Коррел. анализ. xls и перейдите на лист Задание;

3. Подключите в Excel пакет анализа:

Меню СЕРВИС – Надстройки – Пакет анализа – ОК; 

Меню СЕРВИС – Анализ данных – Корреляция – ОК;

4. Укажите следующие параметры диалогового окна «Корреляция»:

1. Входной интервал

Укажите массив исходных показателей, выделив мышкой все значения ис­следуемых переменных (Y1, Х10, Х14, Х15, X16).

2. Группирование

Установите переключатель в положение по столбцам.

Метки в первой строке

Поставьте флажок в опции Метки в первой строке, чтобы добавить во входной диапазон верхнюю строку, содержащую названия переменных, тогда корреляци­онная матрица будет выведена с названиями переменных.

Выходной интервал

Поставьте точку в опции Выходной интервал, затем щелкните мышью в строке напротив надписи Выходной интервал и щелкните мышью в ячейку G1 листа Задание.

После установки указанных параметров нажмите на кнопку ОК.

 

Получим корреляционную матрицу в следующем виде:

Таблица 1

 

Y1

X10

Х14

Х15

X16

Y1

1

 

 

 

 

X10

-0,02152

1

 

 

 

Х14

0,577299

-0,03604

1

 

 

Х15

0,334637

0,153663

0,077981

1

 

X16

-0,2042

-0,34832

-0,16676

-0,25017

1

 

5. Для дальнейших расчётов необходимо привести корреляционную матрицу к обычному виду, заполнив верхний треугольник таблицы. При этом надо учесть, что матрица парных коэффициентов корреляции является симметричной, и коэффициенты rij = rji. Скопируйте нужные парные коэффициенты корреляции в соответствующие ячейки.

В результате мы получим матрицу парных коэффициентов корреляции размерности 5x5:

                        

                         Таблица 2

Y1

X10

Х14

Х15

X16

Y1

1

-0,02152

0,577299

0,334637

-0,2042

X10

-0,02152

1

-0,03604

0,153663

-0,34832

Х14

0,577299

-0,03604

1

0,077981

-0,16676

Х15

0,334637

0,153663

0,077981

1

-0,25017

X16

-0,2042

-0,34832

-0,16676

-0,25017

1

6. Далее необходимо проверить значимость полученных коэффициентов корреляции, т.е. гипотезу Hо: rij = 0. Для этого рассчитаем наблюдаемые значения t-статистики для всех ко­эффициентов корреляции по формуле:

Для этого скопируйте предыдущую таблицу и вставьте ее под самой собой, отступив две строки. Удалите из таблицы все числовые данные и установите курсор в ячейку на пересечении переменных Y1 и Х10. Находясь в указанной ячейке, введите в строку формул выражение для записи вышеуказанной формулы в следующем виде:

=(H3/КОРЕНЬ(1-H3*H3))*КОРЕНЬ(49).

При вводе данного выражения необходимо щелкать мышью в ячейку с соответствующим коэффициентом, для которого рассчитывается значение t-статистики, в данном случае в ячейку H3. Введя указанное выражение, нажмите ENTER. Растяните введенную формулу с помощью черного крестика по соседним ячейкам, в результате у вас должна получиться следующая матрица наблюдаемых значений t-статистики:

            

Таблица 3

tнабл

Y1

X10

Х14

Х15

X16

Y1

 

 

 

 

 

X10

-0,15071

 

 

 

 

Х14

4,949094

-0,25242

 

 

 

Х15

2,485769

1,088567

0,547536

 

 

X16

-1,4602

-2,60115

-1,18391

-1,80872

 

 

Мы вычислили наблюдаемые значения t-статистики только для нижнего треугольника таблицы, поскольку матрица парных коэффициентов корреляции является симметричной.

7. Наблюдаемые значения t-статистик необходимо сравнить с критическим значением tкр, найденным для уровня значимости α=0,05 и числа степенен свободы ν=п-2. Для этого используем встроенную функцию Excel ВСТАВКА Функция – Статистические – СТЬЮДРАСПОБР.

Для расчета tкр выделите пустую ячейку, затем вызовите функцию СТЬЮДРАСПОБР, введите в поле Вероятность число 0,05, а в поле Степени_свободы – число 49, поскольку всего мы имеем 51 наблюдение, поэтому ν=п-2=51-2=49. Нажав на кнопку ОК, мы получим следующее значение tкр = 2,009574.

Сравним рассчитанные нами наблюдаемые значения t-статистики с критическим (табличным) и опреде­лим, какие коэффициенты значимы, а какие нет. Коэффициент значим, если его |tнабл| > tкр.

8. Отметьте жирным шрифтом в таблице значимые коэффициенты корреляции:

Таблица 4

Матрица парных коэффициентов корреляции исследуемых показателей с выделением зна­чимых коэффициентов (при α=0,05)

                   

 

Y1

X10

Х14

Х15

X16

Y1

1

-0,02152

0,577299

0,334637

-0,2042

X10

-0,02152

1

-0,03604

0,153663

-0,34832

Х14

0,577299

-0,03604

1

0,077981

-0,16676

Х15

0,334637

0,153663

0,077981

1

-0,25017

X16

-0,2042

-0,34832

-0,16676

-0,25017

1

9. Для значимых парных коэффициентов корреляции построим с заданной надёжностью γ=0,95 интервальную оценку rmin< r < rтах с помощью Z-преобразования Фишера (см. формулы в лекции). Z' можно найти, используя функцию Excel:

ВСТАВКА Функция – Статистические – ФИШЕР, в качестве аргумента вводится значение соответствующего выборочного коэффициента корреляции r

10. Значение tγ рассчитаем, используя функцию Excel: ВСТАВКА – Функция – Статистические – НОРМСТОБР, где в поле Вероятность вводится значение 0,95. 

Zmin = ; Zmax =

Для обратного преобразования используем функцию Excel: ВСТАВКА Функция – Статистические –ФИШЕРОБР, где в поле Y вводятся ячейки со значением Zmin, Zmax, т.е. для расчета rmin вводим Zmin, а для расчета rтах вводим Zmax.

Расчеты представим в виде следующей таблицы:

Таблица 5

Расчёт доверительных интервалов для парных генеральных коэффициентов корреляции ис­следуемых экономических показателей с надёжностью γ = 0,95

  r Z’ Zmin Zmax rmin rтах
Y1 X14 0,577299 0,658403 0,413403 0,903403 0,3913583 0,71795081
Y1 X15 0,334637 0,348041 0,103041 0,593041 0,10267786 0,5320792
Х10Х16 -0,34832 -0,36353 -0,60853 -0,11853 -0,5430915 -0,11797801

                                          

Таким образом, доверительные интервалы с надёжностью γ = 0,95найдены для всех значимых парных коэффициентов корреляции.

По полученным данным можно сделать следующие выводы:

Между исследуемыми показателями выявлены значимые корреляционные зависимости.

1). Значимая обратная корреляционная взаимосвязь обнаружена между изучаемым при­знаком Х10 - фондоотдача и факторным признаком X16 - оборачиваемость ненормируемых оборотных средств.

2). Между производительностью труда ( Y1) и фондовооруженностью труда 14) имежду производительно­стью труда ( Y1) иоборачиваемостью нормируемых оборотных средств (Х15) существует прямая связь.

3). Наиболее сильная связь существует между результативным признаком производительность труда ( Y1) и факторным признаком фондовооруженность труда 14), причем отмеченная связь прямая.

Расчёт частных коэффициентов корреляции. Сравнение частных и парных коэф­фициентов корреляции.

 

Частные коэффициенты корреляции характеризуют взаимосвязь между двумя выбран­ными переменными при исключении влияния остальных показателей (т.е. характеризуют «чистую» связь только между этими признаками) и важны для понимания взаимодействия всего комплекса показателей, т.к. позволяют определить механизмы усиления-ослабления влияния переменных друг на друга.

Частный коэффициент ( k -2)-гo порядка между переменными, например, между Y1 и Х10 , равен:

,

где Rij - алгебраическое дополнение элемента rij корреляцион­ной матрицы R, равное , где Mij – минор-определитель матрицы, полученный из матрицы R путем вычеркивания i-той строки и j-го столбца.

11. Для расчета частных коэффициентов корреляции нужно сформировать в Excel соответст­вующие матрицы размерности 4*4.

 

Например, алгебраическое дополнение R12 рассчитывается путем вычеркивания из нашей корреляционной матрицы первой строки и второго столбца:

 

Y1

X10

Х14

Х15

X16

Y1

1

-0,02152

0,577299

0,334637

-0,2042

X10

-0,02152

1

-0,036036

0,153663

-0,34832

Х14

0,577299

-0,03604

1

0,077981

-0,16676

Х15

0,334637

0,153663

0,077981

1

-0,25017

X16

-0,2042

-0,34832

-0,166761

-0,25017

1

 

-0,02152

-0,036036

0,153663

-0,34832

0,577299

1

0,077981

-0,16676

0,334637

0,077981

1

-0,25017

-0,2042

-0,166761

-0,25017

1

 

 

 

 



Аналогично

1

-0,036036

0,153663

-0,34832

-0,03604

1

0,077981

-0,16676

0,153663

0,077981

1

-0,25017

-0,34832

-0,166761

-0,25017

1

         

 

 

1

0,577299

0,334637

-0,2042

0,577299

1

0,077981

-0,16676

0,334637

0,077981

1

-0,25017

-0,2042

-0,166761

-0,25017

1

     


 


 

 

Чтобы найти определители этих матриц используем функцию Excel: ВСТАВКА - Функция - Математические - МОПРЕД (указать в качестве массива соот­ветствующую матрицу переменных). Воспользовавшись функцией получаем:

-(-0,05438)

0,786557

0,528443

Подставив значения в формулу, получаем = - 0,084348

Аналогично проводятся расчеты для всех остальных частных коэффициентов корреляции:

R13=(-1)1+3 * M13 = - 0,42585                                         R34=(-1)3+4 * M34 = - (-0,1)            

R14=(-1)1+4 * M14 = - 0,225305                                       R35=(-1)3+5 * M35 = 0,063223

R15=(-1)1+5 * M15 = 0,05218                                            R45=(-1)4+5 * M45 = - (-0,08965)

R23=(-1)2+3 * M23 = - (-0,02282)                                     R33=(-1)3+3 * M33 = 0,702903

R24=(-1)2+4 * M24 = - 0,05483                                         R44=(-1)4+4 * M44 = 0,551944

R25=(-1)2+5 * M25 = - (-0,18526)                                     R55=(-1)5+5 * M55 = 0,561651

 

r13/245 = 0,572722                                                            r25/134 = - 0,340055

r14/235 = 0,341947                                                            r34/125 = - 0,160548

r15/234 = - 0,078507                                                          r35/124 = - 0,100622

r23/145 = - 0,037443                                                          r45/123 = - 0,161016

r24/135 = 0,101525                                                                                                                                                                                    


В результате получим матрицу следующего вида:

Таблица 6 Матрица частных коэффициентов корреляции исследуемых экономических показателей

 

  Y1 X10 Х14 Х15 X16
Y1 1 - 0,084348 0,572722 0,341947 - 0,078507
X10 - 0,084348 1 - 0,037443 0,101525 - 0,340055
Х14 0,572722 - 0,037443 1 - 0,160548 - 0,100622
Х15 0,341947 0,101525 - 0,160548 1 - 0,161016
X16 - 0,078507 - 0,340055 - 0,100622 - 0,161016 1

 

12. Далее необходимо проверить значимость полученных частных коэффициентов корреля­ции. Для этого рассчитаем наблюдаемые значения t-статистик для всех коэффициентов по формуле:

где l - порядок частного коэффициента корреляции, совпадающий с количеством фиксируе­мых переменных случайных величин (в нашем случае l=3),

n - количество наблюдений.

Построим матрицу наблюдаемых значений t-статистик для всех коэффициентов rij:

Таблица 7

Матрица наблюдаемых значений t-статистик для частных коэффициентов корреляции исследуе­мых экономических показателей

tнабл

Y1

X10

Х14

Х15

X16

Y1

 

 

 

 

 

X10

-0,574122

 

 

 

 

Х14

4,7385072

-0,254129

 

 

 

Х15

2,4679682

0,692152

-1,103200

 

 

X16

-0,534109

-2,452522

-0,685933

-1,106502

 

 

 

Наблюдаемые значения t-статистик необходимо сравнить с критическим значением t кр , най­денным для уровня значимости α=0,05 и числа степеней свободы v = n - l -2.

Для этого используем встроенную статистическую функцию Excel СТЬЮДРАСПОБР, введя в диалоговое окно функции вероятность α=0,05 и число степеней свободы v = n - l -2=51-3-2=46.

13. Сравним расчетные значения с критическим и определим, какие коэффициенты значимы. По­лучим матрицу частных коэффициентов корреляции с выделенными значимыми коэффициента­ми:

Таблица 8

Матрица частных коэффициентов корреляции исследуемых показателей с выделением значи­мых коэффициентов (при α=0,05)

  Y1 X10 Х14 Х15 X16
Y1 1 -0,084348 0,572722 0,341947 -0,078507
X10 -0,084348 1 -0,037443 0,101525 -0,34006
Х14 0,572722 -0,037443 1 -0,160548 -0,100622
Х15 0,341947 0,101525 -0,160548 1 -0,161016
X16 -0,078507 -0,34006 -0,100622 -0,161016 1

 

14.Для значимых частных коэффициентов корреляции построим с заданной надёжностью γ интервальную оценку rmin< r < rтах с помощью Z-преобразования Фишера (см. формулы в лекции). Получим следующий результат:

Таблица 9

Расчёт доверительных интервалов для частных генеральных коэффициентов корреляции иссле­дуемых экономических показателей с надёжностью γ = 0,95

  r Z’ Zmin Zmax rmin rтах
Y1 X14 0,572722 0,651564 0,406564 0,896564 0,385551 0,714621
Y1 X15 0,341947 0,356296 0,111296 0,601296 0,110838 0,537971
Х10Х16 -0,340055 -0,354155 -0,599155 -0,109155 -0,536448 -0,108723

 

15. Построим таблицу сравнения выборочных парных и частных коэффициентов корреляции для всех переменных.

Таблица 10

Таблица сравнения выборочных оценок парных и частных коэффициентов корреляции исследуе­мых показателей с выделением значимых коэффициентов (при α=0,05)

 

Между

переменными

Коэффициент корреляции

парный частный
Y1 X10 -0,0215248 -0,084348
Y1X14 0,5772995 0,572722
Y1X15 0,3346368 0,341947
Y1X16 -0,2042044 -0,078507
Х10Х14 -0,03604 -0,037443
Х10Х15 0,153663 0,101525
Х10Х16 -0,34832 -0,34006
Х14Х15 0,077981 -0,160548
Х14Х16 -0,166761 -0,100622
Х15Х16 -0,25017 -0,161016

По полученным данным можно сделать следующие выводы:

1. Значимые корреляционные зависимости, полученные на этапе расчёта парных коэффициентов корреляции, подтвердились и при вычислении частных коэффициентов корреляции. При этом выявлены следующие механизмы воздействия переменных друг на друга: наиболее тесная связь наблюдается между изучаемым признаком Y1 производительность труда и факторными признаками Х14 - фондовооруженность труда и Х15 - оборачиваемость нормируемых оборотных средств (прямые зависимости) и между факторными признаками Х10фондоотдача и X16 - оборачиваемость ненормируемых оборотных средств(обратная зависимость).

2. Воздействие других переменных, что характерно для частного коэффициента корреляции (для парного коэффициента корреляции рассматриваются только две переменные без прочих посторонних), несколько ослабляет положительную взаимосвязь между производительностью труда ( Y1 ) и фондовооруженностью труда ( Х14 ), т.к. величина частного коэффициент корреляции ry 1 x 14 / x 10 x 15 x 16 = 0,573 меньше величины парного коэффициента корреляции ry 1 x 14 = 0,577.

3.  Аналогичная ситуация наблюдается и для обратной связи между фондоотдачей (Х10) и
оборачиваемостью ненормируемых оборотных средств (X16) - при исключении воздействия других
переменных абсолютная величина (взятая по модулю) парного коэффициент корреляции превышает абсолютное
значение частного коэффициента корреляции.

4.  Для связи между производительностью труда (Y1) и оборачиваемостью нормируемых оборотных средств ( Х15 ) характерна об­ратная ситуация: воздействие других переменных усиливает эту взаимосвязь (величина част­ного коэффициента корреляции больше величины парного коэффициента корреляции).

5.  Наиболее сильная связь, выявленная на этапе расчёта парных коэффициентов корреляции,
между производительностью труда ( Y1 ) и фондовооруженностью труда ( Х14 ) остаёт­ся наиболее тесной и значимой и при расчете частных коэффициентов корреляции. Направление связи между данными показателями, как и в случаях с двумя другими значимыми коэффициентами, совпадает для парных и частных коэффициентов корреляции.

 

Расчёт множественных коэффициентов корреляции

 

Множественные коэффициенты корреляции служат мерой связи одной переменной с совме­стным действием всех остальных показателей.

16. Вычислим точечные оценки множественных коэффициентов корреляции. Множествен­ный коэффициент корреляции, например, для 1-го показателя Y1 вычисляется по формуле:

где |R| - определитель корреляционной матрицы R;

Rij - алгебраическое дополнение элемента rij корреляцион­ной матрицы R.

Все алгебраические дополнения Rij были найдены ранее, на этапе расчёта частных коэф­фициентов корреляции, поэтому осталось вычислить только определитель самой корреляцион­ной матрицы.

Чтобы найти определитель корреляционной матрицы, воспользуемся встроенной математи­ческой функцией Excel МОПРЕД. Получим |R|= 0,453494.

Подставляя полученное значение определителя в формулу, получаем значения множественных коэффициентов корреляции:

= 0,650726           

= 0,376603

= 0,595674           

= 0,422338

= 0,438828

 

 

Множественный коэффициент детерминации получается возведением коэффициента корре­ляции в квадрат.

17. Проверим значимость полученных множественных коэффициентов корреляции и детерми­нации. Проверка осуществляется с помощью F-критерия:

где k - количество рассматриваемых факторов (в нашем случае k = 5),

 п - количество наблюдений.

Произведя расчёты, получим следующую таблицу:

Таблица 11

Множественные коэффициенты корреляции и детерминации исследуемых показателей с выде­лением значимых коэффициентов (на уровне значимости α = 0,05)

Множественный коэффициент корреляции

Множественный коэффициент детерминации r2 Значение стати­стики Fнабл
ry1/x10x14x15x16 0,650726 0,42344433 8,44603564
rx10/y1x14x15x16 0,376603 0,14182982 1,90060545
rx14/y1x10x15x16 0,595674 0,35482751 6,32469069
rx15/y1x10x14x16 0,422338 0,17836939 2,49655734
rx16/y1x10x14x15 0,438828 0,19257001 2,74272097

 

 

18. Для определения значимости множественных коэффициентов корреляции и детерминации нужно найти критическое значение F-распределения для заданного уровня значимости α и числа степеней свободы числителя v1= k-1 и знаменателя v2= n- k.

Для определения Fкр воспользуемся встроенной функцией Excel: ВСТАВКА - Функция - Статистические - FРАСПОБР, введя в диалоговое окно функции вероятность α = 0,05 и число степеней свободы v1= k-1=5-1=4 и v2= n- k=51-5-46.

Получаем Fкр = 2,574033

Если наблюдаемое значение F-статистики превосходит ее критическое значение, то гипотеза о равенстве нулю соответствующего множественного коэффициента корреляции отвергается.

Следовательно, в рассматриваемом примере значимыми являются множественные коэффициенты корреляции ry1/x10x14x15x16, rx14/y1x10x15x16, rx16/y1x10x14x15. Множественные коэффициенты корреляции rx10/y1x14x15x16 и rx15/y1x10x14x16 являются незначимыми.

Результаты проведенного анализа позволяют сделать следующие выводы:

1.Множественный коэффициент корреляции ry1/x10x14x15x16 = 0,651 значим и имеет достаточно высокое значение, что говорит о том, показатель Y1 производительность труда имеет тесную связь с многомерным массивом факторных признаков Х10 - фондоотдача, Х14 - фондовооруженность труда, Х15 - оборачиваемость нормируемых оборотных средств и X16 - оборачиваемость ненормируемых оборотных средств. Это даёт ос­нование для проведения дальнейшего регрессионного анализа.

2.Множественный коэффициент детерминации ry1/x10x14x15x162 = 0,423 показывает, что 42,3% доли дисперсии Y1 производительности труда, обусловлены изменениями факторных призна­ков.

3.Факторные признаки Х14 - фондовооруженность труда и X16 - оборачиваемость ненормируемых оборотных средств, также имеют значимые значения множественных коэффици­ентов корреляции и детерминации, что свидетельствует о их достаточно сильной взаимосвязи с рассматриваемыми признаками. Однако, хотя множественные коэффициенты фактора X16 и значимы, но только 19,3% доли его дисперсии обусловлены изменениями переменных, включённых в рассматриваемую мо­дель, а, соответственно 80,7% его дисперсии обусловлены влиянием других, не включённых в модель факторов.

4.Полученные результаты корреляционного анализа, показавшие, что показатель Y1 производительность труда, имеет тесную связь с многомерным массивом факторных признаков, позволяют пе­рейти ко второму этапу статистического исследования - построению регрессионной модели.

 


Дата добавления: 2021-04-05; просмотров: 46; Мы поможем в написании вашей работы!

Поделиться с друзьями:




Мы поможем в написании ваших работ!