Условные математические ожидания и их свойства.



Пусть случайный вектор (X,Y) задан рядом распределения. Обозначим через

  y1 y2  
x1 x2 . . . p11 p12 … p21 p22 … . . . . . . p1. p2. . . .
  p.1 p.2 1


О. Условным математическим ожиданием случайной величины Y при условии, что случайная величина X приняла значение xi называется число Все пространство элементарных исходов можно разбить на следующие части:

Введем случайную величину: , если . Эта случайная величина дискретная с рядом распределения:

M(Y|X) M(Y|X=x1) M(Y|X=x2)
p p1. p2.

О. Случайная величина M(Y|X) называется условным математическим ожиданием Y при условии X.

Свойства условного математического ожидания:

1. M(C|X)=C. , отсюда

2. M(Y1+Y2|X)=M(Y1|X)+M(Y2|X).

Справедлива формула полного математического ожидания:

 

Оснавная теорема регрессионного анализа.

Теорема (Основная теорема регрессионного анализа).

Наилучшим прогнозом случайной величины Y по случайной величине X в среднем квадратическом смысле является условное математическое ожидание  Другими словами, если h(x) – любой прогноз Y по X, то математическое ожидание

 

Уравнения линейной регрессии.

О. Уравнение Y=f(X), где f(X)=M[Y|X] называется уравнением регрессии Y на X (прогноза Y по X).

Если обозначить через g(Y)=M(X|Y), то

О. Уравнение X=g(Y), где g(Y)=M(X|Y) называется уравнением регрессии X на Y (гипотеза Y по X)

О. Регрессия Y на X называется линейной, если f(X)=M(Y|X)=a0+a1X.(1) О. Регрессия X на Y называется линейной, если g(Y)=M(X|Y)=b0+b1Y.

Обозначим через MX=a, MY=b, ,  и через r коэффициент корреляции

Применим математическое ожидание к обеим частям уравнения (1)  Вычтем из (1)-(2’)

Применим операцию МО еще раз

 Из этого находим постоянную . Подставим в (3) . Искомое уравнение регрессии имеет вид: - уравнение линейной регрессии Y на X. Аналогично  - уравнение линейной регрессии X на Y.

 

Выборочные уравнения линейной регрессии.

На практике, как правило, иметься только выборка. Например, ( ),…,( ). Эмпирический коэффициент корреляции r является мерой тесноты линейной связи между двумя случайными величинами. С геометрической точки зрения это означает, что чем теснее располагаются точки на диаграмме рассеивания вокруг линии регрессии, тем выше абсолютная величина регрессии и наоборот. На рисунке 1-4 изображены несколько диаграмм рассеивания.

 

 

Диаграмма на рис.1 указывает на отрицательную функциональную связь (r=-1), на рис.2- на относительно высокую степень положительной корреляции (r≈0,8), на рис.3- умеренную степень отрицательной корреляции (r≈ -0,5), на рис.4 – отсутствие корреляции (r=0). По диаграмме рис.4 видно, что если коэффициент корреляции равен 0 , то независимо от того, чему равна величина переменной X , оцениваемая величина зависимой переменной всегда равна .

Сначала , для построения диаграммы рассеивания строят корреляционное поле, т.е. наносят на плоскость все точки.                                                   

Если видят , что точки имеют тенденцию к линейной зависимости , начинают строить линейную регрессию.

 


Дата добавления: 2018-05-13; просмотров: 276; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!