Условные математические ожидания и их свойства.
Пусть случайный вектор (X,Y) задан рядом распределения. Обозначим через 
| y1 y2 … | ||
| x1 x2 . . . | p11 p12 … p21 p22 … . . . . . . | p1. p2. . . . |
| p.1 p.2 | 1 |
О. Условным математическим ожиданием случайной величины Y при условии, что случайная величина X приняла значение xi называется число
Все пространство элементарных исходов можно разбить на следующие части:
Введем случайную величину:
, если
. Эта случайная величина дискретная с рядом распределения:
| M(Y|X) | M(Y|X=x1) | M(Y|X=x2) | … |
| p | p1. | p2. | … |
О. Случайная величина M(Y|X) называется условным математическим ожиданием Y при условии X. 
Свойства условного математического ожидания:
1. M(C|X)=C.
, отсюда 
2. M(Y1+Y2|X)=M(Y1|X)+M(Y2|X).
Справедлива формула полного математического ожидания:
Оснавная теорема регрессионного анализа.
Теорема (Основная теорема регрессионного анализа).
Наилучшим прогнозом случайной величины Y по случайной величине X в среднем квадратическом смысле является условное математическое ожидание
Другими словами, если h(x) – любой прогноз Y по X, то математическое ожидание 

Уравнения линейной регрессии.
О. Уравнение Y=f(X), где f(X)=M[Y|X] называется уравнением регрессии Y на X (прогноза Y по X).
Если обозначить через g(Y)=M(X|Y), то
О. Уравнение X=g(Y), где g(Y)=M(X|Y) называется уравнением регрессии X на Y (гипотеза Y по X)
О. Регрессия Y на X называется линейной, если f(X)=M(Y|X)=a0+a1X.(1) О. Регрессия X на Y называется линейной, если g(Y)=M(X|Y)=b0+b1Y.
Обозначим через MX=a, MY=b,
,
и через r коэффициент корреляции 
Применим математическое ожидание к обеим частям уравнения (1)
Вычтем из (1)-(2’)

Применим операцию МО еще раз
Из этого находим постоянную
. Подставим в (3)
. Искомое уравнение регрессии имеет вид:
- уравнение линейной регрессии Y на X. Аналогично
- уравнение линейной регрессии X на Y.
Выборочные уравнения линейной регрессии.
На практике, как правило, иметься только выборка. Например, (
),…,(
). Эмпирический коэффициент корреляции r является мерой тесноты линейной связи между двумя случайными величинами. С геометрической точки зрения это означает, что чем теснее располагаются точки на диаграмме рассеивания вокруг линии регрессии, тем выше абсолютная величина регрессии и наоборот. На рисунке 1-4 изображены несколько диаграмм рассеивания.

Диаграмма на рис.1 указывает на отрицательную функциональную связь (r=-1), на рис.2- на относительно высокую степень положительной корреляции (r≈0,8), на рис.3- умеренную степень отрицательной корреляции (r≈ -0,5), на рис.4 – отсутствие корреляции (r=0). По диаграмме рис.4 видно, что если коэффициент корреляции равен 0 , то независимо от того, чему равна величина переменной X , оцениваемая величина зависимой переменной всегда равна
.
Сначала , для построения диаграммы рассеивания строят корреляционное поле, т.е. наносят на плоскость все точки.
Если видят , что точки имеют тенденцию к линейной зависимости , начинают строить линейную регрессию.
Дата добавления: 2018-05-13; просмотров: 293; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!
