Условные математические ожидания и их свойства.

Пусть случайный вектор (X,Y) задан рядом распределения. Обозначим через

	y₁y₂ …
x₁ x₂ _. _. _.	p₁₁p₁₂ … p₂₁p₂₂ … . . . . . .	p₁_. p₂_. . . .
	p.₁p.₂	1

О. Условным математическим ожиданием случайной величины Y при условии, что случайная величина X приняла значение x_i называется число Все пространство элементарных исходов можно разбить на следующие части:

Введем случайную величину: , если . Эта случайная величина дискретная с рядом распределения:

M(Y\|X)	M(Y\|X=x₁)	M(Y\|X=x₂)	…
p	p₁_.	p₂_.	…

О. Случайная величина M(Y|X) называется условным математическим ожиданием Y при условии X.

Свойства условного математического ожидания:

1. M(C|X)=C. , отсюда

2. M(Y₁+Y₂|X)=M(Y₁|X)+M(Y₂|X).

Справедлива формула полного математического ожидания:

Оснавная теорема регрессионного анализа.

Теорема (Основная теорема регрессионного анализа).

Наилучшим прогнозом случайной величины Y по случайной величине X в среднем квадратическом смысле является условное математическое ожидание Другими словами, если h(x) – любой прогноз Y по X, то математическое ожидание

Уравнения линейной регрессии.

О. Уравнение Y=f(X), где f(X)=M[Y|X] называется уравнением регрессии Y на X (прогноза Y по X).

Если обозначить через g(Y)=M(X|Y), то

О. Уравнение X=g(Y), где g(Y)=M(X|Y) называется уравнением регрессии X на Y (гипотеза Y по X)

О. Регрессия Y на X называется линейной, если f(X)=M(Y|X)=a₀+a₁X.(1) О. Регрессия X на Y называется линейной, если g(Y)=M(X|Y)=b₀+b₁Y.

Обозначим через MX=a, MY=b, , и через r коэффициент корреляции

Применим математическое ожидание к обеим частям уравнения (1) Вычтем из (1)-(2’)

Применим операцию МО еще раз

Из этого находим постоянную . Подставим в (3) . Искомое уравнение регрессии имеет вид: - уравнение линейной регрессии Y на X. Аналогично - уравнение линейной регрессии X на Y.

Выборочные уравнения линейной регрессии.

На практике, как правило, иметься только выборка. Например, ( ),…,( ). Эмпирический коэффициент корреляции r является мерой тесноты линейной связи между двумя случайными величинами. С геометрической точки зрения это означает, что чем теснее располагаются точки на диаграмме рассеивания вокруг линии регрессии, тем выше абсолютная величина регрессии и наоборот. На рисунке 1-4 изображены несколько диаграмм рассеивания.

Диаграмма на рис.1 указывает на отрицательную функциональную связь (r=-1), на рис.2- на относительно высокую степень положительной корреляции (r≈0,8), на рис.3- умеренную степень отрицательной корреляции (r≈ -0,5), на рис.4 – отсутствие корреляции (r=0). По диаграмме рис.4 видно, что если коэффициент корреляции равен 0 , то независимо от того, чему равна величина переменной X , оцениваемая величина зависимой переменной всегда равна .

Сначала , для построения диаграммы рассеивания строят корреляционное поле, т.е. наносят на плоскость все точки.

Если видят , что точки имеют тенденцию к линейной зависимости , начинают строить линейную регрессию.

Дата добавления: 2018-05-13; просмотров: 276; Мы поможем в написании вашей работы!

Поделиться с друзьями:

⇐ Предыдущая 1 2 345 6 7 Следующая ⇒

Мы поможем в написании ваших работ!