ИЗМЕРЕНИЕ СТЕПЕНИ ТЕСНОТЫ СВЯЗИ MEЖДУ ИССЛЕДУЕМЫМИ ПЕРЕМЕННЫМИ



 

После предварительной обработки исходной информации становится возможной количественная оценка интенсивности связи между исследуемыми переменными. Она производится с помощью коэффициентов корреляции (парных и множественных) – в случае линейной связи и корреляционных отношений – в случае нелинейной связи.

Парный коэффициент корреляции характеризует связь между двумя случайными величинами  и при условии линейной корреляции между ними. Он рассчитывается по формуле:

            (19)

Коэффициент корреляции является отвлеченным числом и не зависит от единиц, в которых измерялись значения  и . Он показывает, насколько изменяется в среднем случайная величина при изменении величины  на  при условии влияния на  всех прочих учтенных и неучтенных факторов. Величина  лежит в пределах от -1 до +1. Чем выше значение , тем теснее связь между переменными и тем с большим основанием найденная впоследствии связь между переменными может быть использована в анализе, прогнозировании и т.п.

В советской литературе принято оценивать степень тесноты связи между исследуемыми переменными по следующей шкале:

- если   0,3, – связь слабая;

- если 0,З  0,7 – связь средняя;

- если  0,7 – связь сильная.

Помимо отмеченных коэффициент корреляции обладает еще следующими свойствами:

- при  наблюдается не корреляционная, а функциональная связь;

- при   – связь прямая, при  – связь обратная.

В случае множественной корреляции расчет парных коэффициентов корреляций между парой исследуемых переменных приводит к образованию матрицы парных коэффициентов. Для рассматриваемой экономико-математической модели влияния субъективных факторов производительности труда на процент выполнения норм выработки станочников механического цеха матрица парных коэффициентов корреляции приведена в приложении 3. Наиболее сильной оказалась связь между функцией и общим стажем работа станочников ( = 0,57), несколько меньше связь между функцией и возрастом станочников ( = 0,53). Слаба зависимость функции от законченного образования станочников ( = 0,28). Вполне объяснимы высокая связь медду возрастом рабочих и их стажем ( = 0,95), а также обратные связи между возрастом и образованием (  = - 0,11) и стажем и образованием ( = - 0,055).

Полученные при этом парные коэффициенты корреляции имеют вполне определенное толкование. Так, например, коэффициент корреляции  = 0,28 показывает, что при повышении станочником уровня своего образования на  = 1,97 класса он получит рост выполнения нормы выработки на 6,67 % (0,28 =0,28·23,83).

При анализе парных коэффициентов корреляции необходимо обратить внимание на наличие в экономико-математической модели мультиколлинеарности, под которой понимается наличие функциональной или близкой к ней связи между факторами (показателями). В качестве своеобразных индикаторов возможного наличия мультиколлинеарности выступают парные коэффициенты корреляции факторов-аргументов .Если коэффициент корреляции больше 0,8, это говорит о наличии в модели мультиколлинеарности. Мультиколлинеарность снижает надежность оценок параметров экономико-математической модели, приводит к неверным выводам, поэтому при ее обнаружении мультиколлинеарные факторы подлежат исключению из модели.

В рассматриваемом примере коллинеарны два фактора: возраст рабочих  и общий стаж их работа   ( = 0,95). Один из этих факторов, имеющий меньший коэффициент корреляции с функцией [14, с. 54] , должен быть исключен. Таким фактором является возраст рабочих, так как .

Таким образом, на этапе определения тесноты связи между исследуемыми переменными происходит дальнейшее уточнение исходной экономико-математической модели. Для рассматриваемого примера она формулируется теперь следующим образом: по данным табеля, имеющейся отчетности, опроса, найти аналитическое выражение, показывавшее, как связаны между собой процент выполнения норм выработки станочников механического цеха Тульского комбайнового завода  и определяющие его показатели: законченное образование рабочих  и общий стаж их работы  , т.е. определить функцию:

.                                         (20)

Линейный коэффициент корреляции достаточно точно оценивает степень тесноты связи в случае линейной зависимости между признаками. При наличии же нелинейной зависимости он недооценивает степень тесноты связи. Поэтому при необходимости точной оценки степени тесноты связи в случае криволинейной корреляции между признаками  и рассчитывают теоретическое корреляционное отношение:

,                                                    (21)

где  – дисперсия признака ;

 – межгрупповая дисперсия признака , характеризующая ту часть его колеблемости, которая складывается под влиянием изменения признака ,

.                                          (22)

Заметим, что в отличие от линейных коэффициентов корреляции .

Рассчитаем  для оценки тесноты связи между процентом выполнения норм выработки станочников механического цеха и их общим стажем работы (см. таблицу 3). Анализ поля корреляции и формы эмпирической линии регрессии не исключает криволинейной связи между функцией и указанным аргументом (см. рисунок 4). Сведем расчет  в таблицу 6 ( = 173,72,  = 567,87).

 

Таблица 6 – Расчет *

 

Интервалы по
0 - 5 9 157,7 -16,02 256,64 2309,76
5 - 10 6 162,8 -10,92 119,25 716,50
10 - 15 9 164,6 - 9,12 83,17 748,53
15 - 20 4 168,0 - 5,72 32,72 130,88
20 - 25 6 175,8 2,06 4,24 25,44
25 - 30 4 194,8 21,08 444,37 1777,48
30 - 35 10 190,8 17,08 291,73 2917,30
35 - 40 2 197,5 23,78 565,49 1130,98
Итого… 50 9755,77

 

.

Поэтому практически и в случае нелинейной корреляции основным показателем оценки тесноты связи между двумя переменными остается парный коэффициент корреляции, хотя он несколько снижает результат. Это нашло отражение и в рекомендуемой машинной программе расчета параметров нелинейной регрессии (см. приложение 5).

 

Значение  несколько больше  = 0,57 вследствие разного подхода к их расчету (точного по каждому наблюдению для и грубого группового для ). Практически же они совпадают.

Аналогичным образом было рассчитано отношение . Оно составило 0,73, что значительно превышает fa = 0,28 и свидетельствует о наличии нелинейной связи между  и .

На практике корреляционное отношение как показатель оценки тесноты связи широкого применения не получило, так как, во-первых, оно не оценивает направления связи (ибо изменяется только от 0 до +1), и, во-вторых, требует построения группировочных таблиц большого числа наблюдений.

Помимо парных коэффициентов корреляции рассчитывают еще и частные коэффициенты корреляции. Они позволяют выявить "чистую" зависимость факторов друг от друга при условии, что значения остальных факторов остаются постоянными. Поэтому абсолютные значения частных коэффициентов корреляции не могут быть больше коэффициента множественной корреляции.

В рассматриваемой модели (20) имеем следующие частные коэффициента корреляции (см. приложение 4):  = 0,38;  = 0,61; = -0,27, Они по абсолютной величина выше соответствующих парных коэффициентов корреляции (  = - 0,28;  = 0,57;  = -0,06), поскольку исключено (элиминировано) влияние остальных факторов. Так,  = 0,38 показывает, что если, исходная выборка будет представлена рабочими с одним и тем же стажем работы, увеличение уровня образования у одного из них на  = 1,97 класса должно привести к росту выполнения им своей нормы выработки на 0,28 =0,38·23,83=9%.

Тесноту связи между функцией и совокупностью всех аргументов в случае множественной корреляции характеризует множественный коэффициент корреляции . Он положителен, изменяется от 0 до +1 и определяется по формуле:

,        (23)

где  – коэффициент регрессии при i-й переменной в стандартизованном масштабе.

В программах множественной линейной и нелинейной регрессий  вычисляется в процессе шаговой регрессии в зависимости от числа включаемых в уравнение факторов-аргументов. Так, в рассматриваемом примере   увеличивается от 0,566 до 0,647 по мере включения в уравнение обоих факторов-аргументов (см, приложение 4).

При малом числе наблюдений значение  получается завышенным, поэтому его корректируют на число наблюдений и переменных. Корректировка  производится по формуле:

,                            (24)

где – множественный коэффициент корреляции, скорректированный с учетом степеней свободы.

В рассматриваемом примере линейной регрессии (см. приложение 4) на втором шаге регрессии множественный коэффициент корреляции уменьшен с  = 0,647 до = 0,637. Именно последнее значение и показывает истинную степень тесноты связи между процентом выполнения норм выработки станочников и введенным в модель субъективными факторами. По приведенной выше шкале указанная связь может быть отнесена к связям средней интенсивности. Сравнивая при этом коэффициенты множественной корреляции, вычисленные по программам линейной и нелинейной регрессий (см. приложения 4,5), видим, что в случае нелинейной регрессии коэффициент множественной корреляции ниже, т.е. <  (0,556<0,637). Объясняется это использованием при расчете  разных уравнений регрессии и соответственно различных коэффициентов.

Вариация функции складывается под влиянием факторов как введенных в модель, так и не учтенных в модели. Квадрат коэффициента корреляции , называемый коэффициентом детерминации, и показывает долю влияния учтенных факторов-аргументов на вариацию фактора-функции. В программах множественной регрессии коэффициенты детерминации сгруппированы в вектор, который распечатывается после матрицы парных коэффициентов корреляции (см. приложения 4,5). Первый из коэффициентов этого вектора (в рассматриваемом примере = 0,418) представляет квадрат множественного коэффициента корреляции функции и совокупности двух факторов-аргументов. В данном случае величина  свидетельствует о том, что введенные в модель субъективные факторы – законченное образование рабочих и общий стаж их работы – обеспечивают 41,8 % общего изменения процентов выполнения ими норм выработки. 58,2 % вариации функции приходятся на долю не включенных в модель других субъективных и объективных факторов. Остальные коэффициенты вектора множественной детерминации  рассчитаны из предположения, что -я переменная и функция модели меняются местами.

После расчета коэффициентов корреляции необходимо проверить их существенность, т.е. в какой мере полученные значения коэффициентов корреляции в выборочных совокупностях распространяются на соответствующие генеральные совокупности.

В качестве критерия значимости (надежности) парных и частных коэффициентов корреляции может быть применено значение распределения Стьюдента :

 .                                                   (25)

В программах регрессий  рассчитываются для частных коэффициентов корреляции исследуемых зависимостей и распечатываются в виде матрицы значений распределения Стьюдента. Их необходимо сопоставить с табличными, приведенными в приложении 7. Табличные значения даны для  степеней свободы и задаваемого уровня значимости. Наиболее распространенным является уровень 0,05. Если

 .                                         (26)

то коэффициент корреляции в генеральной совокупности заметно отличен от 0, т.е. данный коэффициент корреляции существен.

Для оценки надежности множественного коэффициента корреляции (детерминации) используется критерий Фишера:

.                                      (27)

с   и  степенями свободы. В программах множественной регрессии значения  распечатаны после вектора коэффициентов множественной детерминации. Если

,                                          (28)

то связь существенна.

Значения  приведены в приложении 8 для уровня значимости 0,05. В рассматриваемом примере при = 3 и = 46 имеем = 2,84 и  = 11,01. Следовательно, связь между функцией и совокупностью аргументов в анализируемой модели (20) также достоверна.

 


Дата добавления: 2018-05-02; просмотров: 405; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!