ЛЕКЦИЯ 7: «КОРРЕЛЯЦИОННЫЙ АНАЛИЗ. РЕГРЕССИОННЫЙ АНАЛИЗ»



Корреляционная зависимость.

Определение 1. Две случайные величины X и Y находятся в корреляционной зависимости, если каждому значению любой из этих величин соответствует определённое распределение вероятностей другой величины.

Определение 2. Условным математическим ожиданием дискретной случайной величины X при Y = y (y - определённое возможное значение Y) называют сумму произведений возможных значений величины X на их условные вероятности:

,

где  - условная вероятность равенства  при условии, что Y = y.

Для непрерывных величин

,

где  - плотность вероятности случайной непрерывной величины X при условии Y = y.

Условное математическое ожидание  есть функция от y: , которую называют функцией регрессии величины X на величину Y.

Аналогично определяется условное математическое ожидание случайной величины Y и функция регрессии Y на X:

.

Уравнение  называют уравнением регрессии X на Y (Y на X), а линию на плоскости, соответствующую этому уравнению, называют линией регрессии.

Линия регрессии Y на X (X на Y) показывает, как в среднем зависит Y от X (X от Y).

 

Коэффициент корреляции.

Для характеристики корреляционной зависимости между случайными величинами вводится понятие коэффициента корреляции.

Определение 1. Если X и Y – независимые случайные величины, то

.                                (1)

Если же X и Y не являются независимыми случайными величинами, то, вообще говоря, .

Условились за меру связи (зависимости) двух случайных величин X и Y принять безразмерную величину r, определяемую соотношением

                              (2)

или более кратко соотношением

,                                                    (3)

где

,

и называемую коэффициентом корреляции.

Определение 2. Случайные величины X и Y называют некоррелированными, если r =0, и коррелированными, если .

Свойства коэффициента корреляции.

1. Если X и Y независимые случайные величины, то коэффициент корреляции равен нулю.

2. , при этом, если , то между случайными величинами X и Y имеет место функциональная, а именно, линейная зависимость.

3. Как видно из формулы (2), коэффициент корреляции характеризует относительную величину отклонения математического ожидания произведения  от произведения математических ожиданий  величин X и Y. Так как это отклонение имеет место только для зависимых величин, то можно сказать, что коэффициент корреляции характеризует тесноту зависимости между X и Y.

 

Линейная корреляция.

Определение. Корреляционная зависимость между случайными величинами X и Y называется линейной корреляцией, если обе функции регрессии f ( y ) и g ( x ) являются линейными. В этом случае обе линии регрессии являются прямыми; они называются прямыми регрессии.

Обозначим , , , .

Уравнение прямой регрессии Y на X имеет вид

,                                           (4)

где коэффициент  называется коэффициентом регрессии Y на X и вычисляется по формуле:

.                                                       (5)

Аналогично уравнение прямой регрессии X на Y имеет вид

,                                           (6)

где коэффициент регрессии X на Y равен

.                                                      (7)

Уравнения прямых регрессий можно записать в более симметричном виде, если воспользоваться коэффициентом корреляции. С учётом этого коэффициента

, ,                         (8)

и поэтому уравнения прямых регрессий принимают вид

, .

Из формулы (8) видно, что коэффициенты регрессии имеют тот же знак, что и коэффициент корреляции r, и связаны соотношением

.

Расчёт прямых регрессий.

Пусть проведено n опытов, в результате которых получены следующие значения системы величин : . За приближённые значения , ,  и  принимают их выборочные значения

,  , , .

Оценкой для  служит величина

.

Заменяя в соотношениях (3), (4), (7) величины  их выборочными значениями , получаем приближённые значения коэффициента корреляции и коэффициентов регрессий

, ,

(  ,  ,  - выборочные коэффициенты соответственно корреляции и регрессий).

Подставив в уравнения (5) и (6) вместо a, b,  и  их приближённые значения, получим выборочные уравнения прямых регрессий:

, .

 


Дата добавления: 2021-02-10; просмотров: 78; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!