Условные математические ожидания и их свойства.
Пусть случайный вектор (X,Y) задан рядом распределения. Обозначим через
y1 y2 … | ||
x1 x2 . . . | p11 p12 … p21 p22 … . . . . . . | p1. p2. . . . |
p.1 p.2 | 1 |
О. Условным математическим ожиданием случайной величины Y при условии, что случайная величина X приняла значение xi называется число Все пространство элементарных исходов можно разбить на следующие части:
Введем случайную величину: , если . Эта случайная величина дискретная с рядом распределения:
M(Y|X) | M(Y|X=x1) | M(Y|X=x2) | … |
p | p1. | p2. | … |
О. Случайная величина M(Y|X) называется условным математическим ожиданием Y при условии X.
Свойства условного математического ожидания:
1. M(C|X)=C. , отсюда
2. M(Y1+Y2|X)=M(Y1|X)+M(Y2|X).
Справедлива формула полного математического ожидания:
Оснавная теорема регрессионного анализа.
Теорема (Основная теорема регрессионного анализа).
Наилучшим прогнозом случайной величины Y по случайной величине X в среднем квадратическом смысле является условное математическое ожидание Другими словами, если h(x) – любой прогноз Y по X, то математическое ожидание
Уравнения линейной регрессии.
О. Уравнение Y=f(X), где f(X)=M[Y|X] называется уравнением регрессии Y на X (прогноза Y по X).
Если обозначить через g(Y)=M(X|Y), то
О. Уравнение X=g(Y), где g(Y)=M(X|Y) называется уравнением регрессии X на Y (гипотеза Y по X)
О. Регрессия Y на X называется линейной, если f(X)=M(Y|X)=a0+a1X.(1) О. Регрессия X на Y называется линейной, если g(Y)=M(X|Y)=b0+b1Y.
|
|
Обозначим через MX=a, MY=b, , и через r коэффициент корреляции
Применим математическое ожидание к обеим частям уравнения (1) Вычтем из (1)-(2’)
Применим операцию МО еще раз
Из этого находим постоянную . Подставим в (3) . Искомое уравнение регрессии имеет вид: - уравнение линейной регрессии Y на X. Аналогично - уравнение линейной регрессии X на Y.
Выборочные уравнения линейной регрессии.
На практике, как правило, иметься только выборка. Например, ( ),…,( ). Эмпирический коэффициент корреляции r является мерой тесноты линейной связи между двумя случайными величинами. С геометрической точки зрения это означает, что чем теснее располагаются точки на диаграмме рассеивания вокруг линии регрессии, тем выше абсолютная величина регрессии и наоборот. На рисунке 1-4 изображены несколько диаграмм рассеивания.
Диаграмма на рис.1 указывает на отрицательную функциональную связь (r=-1), на рис.2- на относительно высокую степень положительной корреляции (r≈0,8), на рис.3- умеренную степень отрицательной корреляции (r≈ -0,5), на рис.4 – отсутствие корреляции (r=0). По диаграмме рис.4 видно, что если коэффициент корреляции равен 0 , то независимо от того, чему равна величина переменной X , оцениваемая величина зависимой переменной всегда равна .
|
|
Сначала , для построения диаграммы рассеивания строят корреляционное поле, т.е. наносят на плоскость все точки.
Если видят , что точки имеют тенденцию к линейной зависимости , начинают строить линейную регрессию.
Дата добавления: 2018-05-13; просмотров: 276; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!