Основные понятия корреляционного и регрессионного анализов



При одновременном изучении нескольких признаков какого-либо объекта или учете нескольких показателей в эксперименте возникает вопрос о взаимосвязях между исследуемыми величинами. Наиболее разработанными в математической статистике методами анализа взаимосвязей являютсякорреляционный и регрессионный анализы.

При изучении взаимосвязи признаки делятся на два класса:

· признаки, обуславливающие изменения других признаков, называются факторными, или факторам;

· признаки, изменяющиеся под действием факторных признаков, называются результативными.

Связь называется статистической, если каждому значению факторного признака соответствует определенное (условное) распределение результативного признака. Корреляционной связью называется частный случай статистической связи, состоящий в том, что разным значениям факторного признака соответствуют различные средние значения результативного.

Корреляционная зависимость между признаками  и  может быть представлена в виде уравнения:

,

где  – условное математическое ожидание признака  при заданном . Это уравнение называется теоретическим уравнением регрессии (или функцией регрессии)  на , а его график – теоретической линией регрессии.

Парная регрессия

В зависимости от вида функции  различают линейную и нелинейную регрессию.

Для отыскания теоретического уравнения регрессии необходимо знать закон распределения двумерной случайной величины . Но на практике исследователь располагает выборкой пар значений  ограниченного объема . В этом случае можно построить лишь наилучшую оценку для функции регрессии, которой является выборочное уравнение регрессии  на  (или просто уравнение регрессии), где  – условная средняя признака  при фиксированном значении признака ,  – параметры уравнения регрессии.

Так, например, оценкой линейного уравнения регрессии  на  является выборочное уравнение регрессии .

Параметры  и  выборочного уравнения регрессии находятся следующим образом:

                                            ;                                      (23)

                                             ,                                       (24)

где  – выборочная средняя факторного признака ,  – выборочная средняя результативного признака ,  – средняя из произведений соответствующих значений факторного и результативного признаков,  – выборочная дисперсия факторного признака .

Коэффициент  в уравнении регрессии называется коэффициентом регрессии (выборочным). Он показывает, насколько изменяется в среднем значение результативного признака при увеличении факторного на единицу собственного измерения.


Дата добавления: 2019-02-22; просмотров: 160; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!