Графическое выражение зависимости и приближенная оценка коэффициента корреляции
Корреляционный анализ (линейная корреляция; статистические характеристики модели; корреляционный момент и парный коэффициент линейной корреляции Пирсона)
КРАТКИЕ ОТВЕТЫ
Корреляционный анализ
Метод обработки статистических данных, заключающийся в изучении коэффициентов корреляции между переменными.
При этом сравниваются коэффициенты корреляции между одной парой или множеством пар признаков для установления между ними статистических взаимосвязей.
Корреляционный анализ применяется только для анализа связи количественных и/или качественных порядковых признаков.
Корреляция линейная
- англ. correlation, linear; Корреляция, при которой отношение степени изменения одной переменной к степени изменения другой переменной является постоянной величиной.
Корреляционный момент
Для прерывных случайных величин корреляционный момент выражается формулой

а для непрерывных - формулой

Корреляционный момент есть характеристика системы случайных величин, описывающая, помимо, рассеивания величин
и
, еще и связь между ними.
Коэффициент корреляции Пирсона (r-Пирсона) применяется для исследования взаимосвязи двух переменных, измеренных в метрических шкалах на одной и той же выборке. Он позволяет определить, насколько пропорциональная изменчивость двух переменных.
Данный коэффициент разработали Карл Пирсон, Фрэнсис Эджуорт и Рафаэль Уэлдон в 90-х годах XIX века. Коэффициент корреляции изменяется в пределах от минус единицы до плюс единицы.
Коэффициент корреляции r-Пирсона характеризует существование линейной связи между двумя величинами. Если связь криволинейная то он не будет работать.
Чтобы приступать к расчетам коэффициента корреляции r-Пирсона необходимо выполнение следующих условий:
1. Исследуемые переменные X и Y должны быть распределены нормально.
2. Исследуемые переменные X и Y должны быть измерены в интервальной шкале или шкале отношений.
3. Количество значений в исследуемых переменных X и Y должно быть одинаковым.
При расчете коэффициент линейной корреляции Пирсона используется специальная формула. Величина коэффициента корреляции варьируется от 0 до 1.
Слабыми сторонами линейного коэффициента корреляции Пирсонаявляются:
- Неустойчивость к выбросам.
- С помощью коэффициента корреляции Пирсона можно определить только силу линейной взаимосвязи между переменными, другие виды взаимосвязей выявляются методами регрессионного анализа.
ОСТАЛЬНОЕ ВСТАВКА С ЕЕ КНИЖКИ И ЛИТЕРАТУРА
Графическое выражение зависимости и приближенная оценка коэффициента корреляции
Одним из способов изучения зависимостей между величинами является построение графиков. На координатных осях в заданном масштабе откладываются значения величин и на координатной плоскости или в координатном пространстве получают серию точек, каждая из которых фиксирует совместное наблюдение двух или более признаков. Пусть имеется серия парных наблюдений значений величин X и Y:
. По этим данным можно построить график, вид которого будет зависеть от характера зависимости между X и . Y . ( рис. 8.1).
Рис. 8.1. Возможные типы зависимости между двумя
переменными.
Для случая I можно сказать, что зависимость между X и Y скорее всего отсутствует. Для случая III можно уверено сказать, что существует четкая функциональная (однознач-но описываемая некоторой функцией) зависимость. Во втором случае можно предполагать, что зависимость между X и Y имеет место, однако описать эту зависимость с помощью некоторой функции можно лишь примерно. Такая зависимость может быть названа статистической. Она не всегда может быть в явном виде установлена на графике и должна быть оценена с помощью специальных статистических процедур.
Предварительное заключение о наличии статистической связи между случайными величинами можно сделать с помощью простой графической процедуры. Имея в виду указанный ранее ряд пар наблюдений, рассчитаем средние значения X и Y и вынесем среднюю точку на график (рис.8.2).

Рис. 8.2. Приближенная оценка зависимости между
случайными величинами.
Проведем через точку средних значений линии параллельно осям координат. Область определения двумерной величины разобьется, таким образом, на четыре части. Если точки совместных наблюдений X и Y распределятся по квадрантам равномерно, то можно будет говорить об отсутствии зависимости между этими случайными величинами. В ином случае можно предполагать такую зависимость и даже рассчитать некоторый показатель этой зависимости, называемый коэффициентом корреляции.
Обозначим число точек в первом и третьем квадрантах как n 1, а во втором и четвертом квадрантах как n 2. Тогда коэффициент корреляции можно приближенно оценить по следующей формуле:
(8.1)
В примере, показанном на рисунке 8.2 количество точек в первом и третьем квадрантах равно 73. а во втором и четвертом квадрантах - 61. Значение коэффициента корреляции будет равно:
Использованный способ расчета коэффициента корреляции дает лишь его грубую оценку и неудобен при большом числе точек наблюдения. Однако он позволяет наглядно представить содержание этого показателя зависимости между случайными величинами. Рисунок 8.2 и формула (8.1) показывают, что значение коэффициента корреляции может меняться от -1 до +1. Отрицательные значения свидетельствуют об обратной зависимости, когда увеличение значений одной величины с некоторой вероятностью сопровождается уменьшением значения другой величины. Положительные значения коэффициента корреляции утверждают прямую или положительную зависимость между величинами. Значения, близкие к нулю (статистически равные нулю) свидетельствуют об отсутствии связи. Утверждение «коэффициент корреляции равен нулю» представляет собой статистическую нулевую гипотезу, проверка которой осуществляется с помощью уже известных нам критериев. Процедура проверки нулевой гипотезы рассмотрена в следующем разделе.
Дата добавления: 2018-11-24; просмотров: 458; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!
