Основные понятия корреляционного и регрессионного анализов
При одновременном изучении нескольких признаков какого-либо объекта или учете нескольких показателей в эксперименте возникает вопрос о взаимосвязях между исследуемыми величинами. Наиболее разработанными в математической статистике методами анализа взаимосвязей являютсякорреляционный и регрессионный анализы.
При изучении взаимосвязи признаки делятся на два класса:
· признаки, обуславливающие изменения других признаков, называются факторными, или факторам;
· признаки, изменяющиеся под действием факторных признаков, называются результативными.
Связь называется статистической, если каждому значению факторного признака соответствует определенное (условное) распределение результативного признака. Корреляционной связью называется частный случай статистической связи, состоящий в том, что разным значениям факторного признака соответствуют различные средние значения результативного.
Корреляционная зависимость между признаками и может быть представлена в виде уравнения:
,
где – условное математическое ожидание признака при заданном . Это уравнение называется теоретическим уравнением регрессии (или функцией регрессии) на , а его график – теоретической линией регрессии.
Парная регрессия
В зависимости от вида функции различают линейную и нелинейную регрессию.
Для отыскания теоретического уравнения регрессии необходимо знать закон распределения двумерной случайной величины . Но на практике исследователь располагает выборкой пар значений ограниченного объема . В этом случае можно построить лишь наилучшую оценку для функции регрессии, которой является выборочное уравнение регрессии на (или просто уравнение регрессии), где – условная средняя признака при фиксированном значении признака , – параметры уравнения регрессии.
|
|
Так, например, оценкой линейного уравнения регрессии на является выборочное уравнение регрессии .
Параметры и выборочного уравнения регрессии находятся следующим образом:
; (23)
, (24)
где – выборочная средняя факторного признака , – выборочная средняя результативного признака , – средняя из произведений соответствующих значений факторного и результативного признаков, – выборочная дисперсия факторного признака .
Коэффициент в уравнении регрессии называется коэффициентом регрессии (выборочным). Он показывает, насколько изменяется в среднем значение результативного признака при увеличении факторного на единицу собственного измерения.
|
|
Дата добавления: 2019-02-22; просмотров: 160; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!