Основные распределения в статистике

Стр 1 из 3Следующая ⇒

Московский Авиационный Институт

(Государственный Технический Университет)

Курсовая работа по теории вероятностей и математической статистике

Выполнил: студент группы 07-206

Леонов А.А.

Принял:

Мирошкин В.Л.

Теоретическая часть.

Некоторые сведения из теории вероятностей

Под случайной величиной (СВ) понимают величину, которая в результате опыта принимает то или иное значение, причем неизвестно заранее, какое именно.

Вероятностный смысл математического ожидания (МО) состоит в том, что оно является средним значением СВ

Дисперсией (рассеянием) СВ называется математическое ожидание квадрата ее отклонения от своего математического ожидания. Характеризует разброс значений СВ относительно ее МО

Функцией распределения СВ Х называется функция F(x), которая для любого x R равна вероятности события { X < x }

Квантилью уровня p СВ Х называется решение уравнения F_X(x_p) ≤ p, т.е. такое x_p при котором вероятность события { X < x_p } не превышает p

Основные непрерывные распределения

Равномерное распределение

Определение 1.1 СВ Х распределена равномерно на отрезке [a,b] (X~R(a;b)), если плотность вероятности имеет вид

Свойства R(a;b)

1) Функция распределения имеет вид (рис. 2)

2) МО и дисперсия по определению равны

Графики функций f(x) и F(x)приведены на рисунке.

f(x)

F(x)

Нормальное распределение

Определение 1. 3. СВ X имеет нормальное (гауссовское) распределение с параметрами т и σ² > 0, т.е. X~N(m;σ²), если

При этом СВ называется нормальной (гауссовской). График плотности нормального распределения, называемый кривой Гаусса, имеет единственный максимум в точке х = т

m₂>m₁

σ₂>σ₁

f(x)

m₁

m₂

Свойства N(m;σ²)

1) функция распределения СВ X ~N(m;σ²) имеет вид

Функцию распределения можно выразить через функцию стандартного нормального распределения следующим образом:

, где

2) МО и дисперсия СВ X ~ N(m;σ²) равны

Вычисления, связанные с нормальным распределением, чаще осуществляются не через ,а через функцию Лапласа

как более удобную, в частности тем, что она является нечетной

Следует, однако помнить что функция (в отличии от ) не является функцией распределения.

Функции связаны соотношением

5) Нормально распределенная СВ с большой вероятностью принимает значения, близкие к своему МО, что описывается «правилом к сигм»:

Математическая статистика – наука о математических методах, позволяющих по статистическим данным, например по реализациям случайной величины (СВ), построить теоретико-вероятностную модель исследуемого явления. Задачи математической статистики являются, в некотором смысле, обратными к задачам теории вероятностей. Центральным понятием математической статистики является выборка.

Определение 1.Однородной выборкой (выборкой) объема n при n 1 называется случайный вектор Z_n=col(X₁,…,X_n), компоненты которого X_i, i= , называемые элементами выборки, являются независимыми СВ с одной и той же функцией распределения F(x). Будем говорить, что выборка Z_n соответствует функции распределения F(x).

Определения 2.Реализацией выборки называется неслучайный вектор z_n=col(x₁,…,x_n), компонентами которого являются реализации соответствующих элементов выборки _Xi, i= .

Из этих определений вытекает, что реализацию выборки zn можно также рассматривать как последовательность x1,…,xn из n реализаций одной и той же СВ X, полученных в серии из n независимых одинаковых опытов, проводимых в одинаковых условиях. Поэтому можно говорить, что выборка Zn порождена наблюдаемой СВ X, имеющей распределение F_x(x)=F(x).

Определение 3.Если компоненты вектора Zn независимы, но их распределения F₁(x₁),…,F_n(x_n) различны, то такую выборку называют неоднородной.

Определение 4.Множество S всех реализаций выборки Z_n называется выборочным пространством.

Выборочное пространство может быть всем n-мерным евклидовым пространством или его частью, если СВ X непрерывна, а также может состоять из конечного или счетного числа точек из Rⁿ, если СВ X дискретна.

На практике при исследовании конкретного эксперимента распределения F₁(x₁),…,F_n(x_n) СВ X₁,…,X_n редко бывают известны полностью. Часто априори (до опыта) можно лишь утверждать, что распределение F_Zn(z_n)=F₁(x₁),…F_n(x_n) случайного вектора Z_nпринадлежит некоторому классу (семейству) F.

Определение 5. Пара (S,F) называется статистической моделью описания серии опытов, порождающих выборку Z_n.

Определение 6.Если распределение F_Zn(z_n,Ө) из класса F определены с точностью до некоторого векторного параметра Ө Θ IR^s, то такая статистическая модель называется параметрической и обозначается (S _Ө, F_Zn(z_n, Ө)), Ө Θ R^s.

В некоторых случаях выборочное пространство может не зависеть от неизвестного параметра Ө распределения F_Zn(z_n,Ө).

Определение 7.СВ Z=φ(Z_n), где φ(Z_n) – произвольная функция, определенная на выборочном пространстве S и не зависящая от распределения F_Zn(z_n,Ө), называется статистикой.

Определение 8. Упорядочим элементы реализации выборки ,..., по возрастанию ,где верхний индекс соответствует номеру элемента в упорядоченной последовательности. Обозначим через , ,случайные величины, которые при каждой реализации выборки принимают -е(по верхнему номеру) значения .Упорядоченную последовательность СВ называю вариационным рядом.

Выборочные моменты

Пусть имеется выборка Z_n = = col(X₁, ...,Х_п), которая порождена СВ X с функцией распределения F_Х (x).

Определение 4.1. Для выборки Z_n объема п выборочными начальными и центральными моментами порядка r СВ X называются следующие СВ:

Определение 4.2. Выборочным средним и выборочной дисперсией СВ X называются соответственно

Пусть существуют исследуемые моменты ν_г, μ_Т. Тогда справедливы следующие свойства.

Свойства выборочных моментов

1) для любого и для всех г = 1,2,

2) , где .

3) .

Основные распределения в статистике

Распределение хи-квадрат

Определение 2. 1. Пусть U_k, , - набор из n независимых нормально распределенных СВ, ~N(0;1). Тогда СВ

Имеет распределение хи-квадрат с n степенями свободы, что обозначается X_n~χ²(n)

Свойства распределения хи-квадрат χ²(n)

1) СВ X_nимеет следующую плотность распределения:

где - гамма-функция.

2) СВ X_n~χ²(n) имеет моменты:

3) Сумма любого числа m независимых СВ X_k, , имеющих распределение хи-квадрат с n_k степенями свободы, имеет распределение хи-квадрат с степенями свободы.

4) Распределение хи-квадрат обладает свойством асимптотической нормальности:

при

где СВ U имеет распределение N(0;1). Это означает, что при достаточно большом объеме n выборки можно приближенно считать X_n~N(n; 2n). Фактически эта аппроксимация имеет место уже при n > 30.

Распределение Стьюдента

Определение 2.2. Пусть U и — независимые СВ, U ~N(0; 1), ~ χ²(n) . Тогда СВ имеет распределение Стьюдента с n степенями свободы, что обозначают как ~S(n).

Свойства распределения Стьюдента S(n)

1) СВ имеет плотность распределения

2) СВ имеет МО, равное М[Т_n] = 0 для всех n 2, и дисперсию D[ ] = n/(n - 2) при n > 2. При n = 2 дисперсия .

3) Можно показать, что при распределение S (n) асимптотически нормально, т. е. , где СВ U имеет распределение N(0; 1). При n 30 распределение Стьюдента S (n) практически не отличается от N(0; 1).

Точечные оценки.

Параметром распределения СВ X называется любая числовая характеристика этой СВ (математическое ожидание, дисперсия и т.п.) или любая константа, явно входящая в выражение для функции распределения.

В общем случае будем предполагать, что параметр распределения θможет быть векторным, т. е.

В случае параметрической статистической модели ( ) таким параметром распределения может служить неизвестный вектор , характеризующий распределение .

Пусть имеется выборка Z_n = со1(X₁, ... ,Х_п) с реализацией z_n = col(x₁, ...,х_п).

Точечной (выборочной) оценкой неизвестного параметра распределения называется произвольная статистика (Z_n), построенная по выборке Z_n и принимающая значения в множестве .

Реализацию (z_n) оценки (Z_n) принимают, как правило, за приближенное значение неизвестного параметра θ.

Дата добавления: 2018-04-05; просмотров: 817; Мы поможем в написании вашей работы!

Поделиться с друзьями:

12 3 Следующая ⇒

Мы поможем в написании ваших работ!