Способы выражения корреляции – коэффициент корреляции




Коэффициент корреляции - количественная мера взаимосвязи (совместной изменчивости) двух переменных.

Часто для определения взаимосвязи между двумя признаками(Х, У) используютнепараметрический (ранговый) коэффициент корреляции Спирмена и параметрический коэффициент корреляции Пирсона.

 

Признаки (характеристики) коэффициентов линейной корреляции (r)

· На основании коэффициентов корреляции можно судить только о прямолинейной корреляционной взаимосвязи между признаками.

· Значения коэффициентов корреляции есть безразмерная величина, которая не может быть меньше -1 и больше +1.

o Если значения коэффициентов корреляции равны нулю, то связь между признаками х, у отсутствует.

o Если значения коэффициентов корреляции отрицательные - связь между признаками Х и Y обратная.

o Если значения коэффициентов корреляции положительные - связь между признаками Х и Y прямая (положительная).

o Коэффициент корреляции = 1.0 (функциональная взаимосвязь, так как значению одного показателя соответствует только одно значение другого показателя и поэтому никакой вариации на диаграмме рассеяния не наблюдается);

o Коэффициент корреляции = 0,0 (корреляции нет).

o Оценка коэффициента корреляции по шкале Чертока:

§ 0,9- 1 очень сильная статистическая связь;

§ 0,9-0,7 сильная;

§ 0,7-0,5 средняя;

§ 0,5-0,3 умеренная;

§ Менее 0,3 – слабая.

§ Менее 0,1 –связь практически отсутствует.

Статистические программы рассчитывают значение статистической значимости (значение р) отличия коэффициента корреляции от 0.

 

Коэффициент детерминации

· Квадрат коэффициента корреляции зависимой и независимой переменных.

· Представляет долю дисперсии зависимой переменной, обусловленной влиянием независимой переменной; показывает, в какой степени изменчивость переменной отклика обусловлена (детерминирована) влиянием другой переменной.

· Обладает важным преимуществом по сравнению с коэффициентом корреляции. Допускается его усреднение для нескольких выборок. В отличие от коэффициента корреляции коэффициент детерминации линейно возрастает с увеличением силы связи.

Коэффициент корреляции Пирсона (Pearson Correlation Coefficient)

 

· Назначение:  используется для оценки силы и направления линейной связи между 2 метрическими переменными в одной выборке. Связь устанавливается между абсолютными значениями признаков.

· Требования к выборке

o Интервальные или абсолютные шкалы измерений.

o Нормальное распределение (или близкое к нормальному).

o Линейность ассоциации.

o Отсутствие выбросов.

Коэффициент ранговой корреляции Спирмена (Spearman's Rho)

 

· Назначение –непараметрический тест, используемый для оценки силы линейной  ассоциации между двумя переменными. При этом связь устанавливается не между самими переменными, а между рангами.

· Требования к переменным

o Ранговая шкала.

o Данные представляются в виде связанных пар.

o Ассоциация между данными должна быть монотоническая – переменные увеличиваются или одна увеличивается, а другая уменьшается.

 

Регрессионный анализ

 


       Линейная регрессия сходна, но не идентична линейной корреляции. Регрессионный анализ проводится, если корреляционный анализ выявил взаимосвязь между переменными.

       Регрессионный анализ позволяет предсказать или оценить значение (зависимой) переменной отклика по известным значениям одной или нескольких (независимых) предикторных переменных.

Виды регрессионного анализа

· Простой – используется одна предикторная переменная.

· Множественная –несколько предикторных переменных.

· Логический –переменная отклика является бинарной (двоичной) категориальной.

· Линейная -переменная отклика непрерывна и линейно связана с независимой (независимыми) переменными.Как линейный так и логический анализ может быть простым или множественным.

· Нелинейная – между переменными, которые связаны нелинейно и не могут быть трансформированы в линейную.

 

Простая линейная регрессия

       С помощью регрессионного анализа определяются параметры прямой, которая наилучшим способом предсказывает значение одной переменной на основании значения другой по уравнению регрессии (регрессия у на х):

у = а + bх,

где у и х значения 2-х переменных (у - зависимая или предикторная; х – независимая, объясняющая); а – точка пересечения прямой с осью ординат (ось У), является начальной ординатой и даёт значение у при х=0, свободный член; b задаёт наклон линии регрессии – среднее изменение у при изменении х на единицу (угловой коэффициент линейной регрессии).

       Статистические программы также рассчитывают статистическую значимость (значение р) отклонения наклона регрессионной прямой, что также является оценкой наличия значимой корреляции 2-х переменных.

 

 

 

ANOVA в отличие от множественного регрессионного анализа (работает с непрерывными предикторными переменными) использует категориальные предикторные переменные. ANCOVA– ковариационный анализ включает как непрерывные так и категориальные предикторные переменные.

 


Дата добавления: 2018-04-05; просмотров: 690; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!