Частные и множественные коэффициенты корреляции



Корреляционная связь между признаками может осуществляться не непосредственно, а косвенно– за счет связи каждого из них в отдельности с каким-либо третьим (четвертым и т.д.) признаком. Например, размеры вегетативных органов обычно сильно коррелируют с высотой растения и для изучения связи между ними в «чистом» виде необходимо найти способ исключить влияние на эту связь высоты растения.

Если рассчитаны парные коэффициенты корреляции rxy, rxz,ryz между тремя признаками (x, y, z), то исключить влияние признакаzна связь между признакамих и уможно, рассчитав по следующей формуле коэффициент частной корреляции:

. (4.10)

Ошибка этого коэффициента рассчитывается по формуле

, (4.11)

а достоверность связи оценивается обычным путем с помощью критерия t

(4.12)

при числе степеней свободы ν=n-3. Полученное значение сравнивают со стандартным, и если оно значительно превосходит стандартное значение критерия, то полученный коэффициент корреляции в высшей степени достоверен. Более строгим способом оценки достоверности служитz-преобразование Фишера, использовать которое целесообразно при низких значениях коэффициента корреляции. Значениеrпредварительно переводят в z=0,5{ln(1+r)-ln(1-r)}. Этот переход осуществляется по готовой таблице, в которую входят по рассчитанному значению r. После этого вычисляют ошибку величины z и критерий t:

(4.13)

. (4.14)

Возьмем конкретный пример. При изучении связей между длиной соцветия (х), длиной листа (у) и высотой растения (z) в выборке (n=150) были получены значения парных коэффициентов корреляции: rxy=0,46;rxz=0,61; ryz=0,7. Требуется установить, какова связь между двумя первыми признаками в «чистом» виде, т.е. не влияет ли высота растения на полученную величину rxy=0,46. Подставляя полученные значения в формулу частного коэффициента корреляции, имеем . Ошибка коэффициента, равная 0,08, превышает его значение, и поэтому без вычисления t ясно, что он недостоверен. Значение связи между длиной листа и длиной соцветия при исключении влияния высоты растения оказалось недостоверным, т.е. в действительности эти признаки независимы друг от друга и в выборке связаны косвенно, через высоту растения.

Задача множественной корреляции по своему смыслу противоположна цели частной корреляции: на основе имеющихся парных коэффициентов корреляции можно установить степень связи одного признака с двумя другими, вместе взятыми. Формула коэффициента множественной корреляции имеет вид

(4.15)

где точка в обозначении rx.yz означает, что изучается взаимосвязь признака х с признаками у и z вместе взятыми. Оценка достоверности коэффициента множественной корреляции производится по общим правилам при ν=n-3.

Вернемся к предыдущему примеру, но поставим теперь другую задачу: установить связь длины соцветия (х) с длиной листа (у) и высотой растения (z) вместе взятыми. Получаем коэффициент множественной корреляции rx · yz=0,61. Полученное значение достоверно, т.к. величине rx · yz=0,61 соответствует z=0,7089. Ошибка величиныzравна mz=1/√147=0,083, a значение t – критерия–t=8,54. При ν=150-3=147 t>tst и любом уровне значимости.

Методы частной и множественной корреляции основаны на использовании коэффициента корреляции и справедливы только для линейной и близкой к ней связи.

 


Дата добавления: 2018-04-15; просмотров: 532; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!