Понятие доверительных интервалов



Важно знать, насколько статистики выборки реально отображают параметры генеральной совокупности, а также утверждать с определенной вероятностью, что рассчитанный интервал выборки содержит требуемый нами параметр генеральной совокупности.

 Например, вместо рассчитанного по выборке среднего значения средним  мы можем говорить об интервале, a < μ < b, в котором с той или иной вероятностью будет содержаться наше среднее генеральной совокупности. Основной момент здесь заключается в том, что мы определяем среднее с какой-либо вероятностью, то есть строим доверительный интервал. Допустим, если мы с 95% вероятностью можем утверждать, что среднее совокупности лежит между 60 и 80, то, если сузим интервал, скажем, до 65 и 75, тогда вероятность того, что среднее попадет в данный интервал, будет, разумеется, меньше, соответственно, если расширим интервал – больше. Все сказанное можно представить в виде схемы:

 

В общих чертах можно представить соотношение среднего генеральной совокупности μ и среднего выборки  в виде следующего равенства:

 

среднее выборки = среднее генеральной совокупности ± ошибка

 = μ ± ошибка

То есть выборочное среднее отличается от среднего генеральной совокупности на число, именуемое ошибкой выборки или, наоборот 6

 

среднее генеральной совокупности = среднее выборки ± ошибка

Таким образом, для построения доверительного интервала необходимо определить ошибку выборки. Однако для каждого конкретного выборочного среднего ошибку знать невозможно, но мы можем узнать вероятность какой-либо заданной ошибки, если будем знать вероятностное распределение этих ошибок.  

Итак, для генеральной совокупности возможен отбор некоторого количества выборок, для каждой из которых возможен расчет выборочного среднего значения:

Таким образом получаем распределение выборочных средних .

Центральная предельная теорема гласит о том, что если переменная X имеет распределение со средним m и стандартным отклонением d, то распределение выборочных средних случайных выборок также будет иметь среднее значение m и стандартное отклонение , которое определяется формулой:

где n-количество наблюдений выборки.

Такое распределение выборочных средних будет приближаться к нормальному при достаточно большом числе независимых наблюдений (обычно n>30).

Пример: генеральная совокупность состоит из четырех объектов: 1, 2, 3 и 4. Предположим, равную вероятность ј = 0,25 того, что мы «вытащим» из этой совокупности каждый объект. Мы должны сделать выборку из этой совокупности, состоящую из двух объектов. Количество возможных вариантов такой выборки равно 16. Все выборки можно представить в виде таблицы:

Первое наблюдение

Второе наблюдение

1 2 3 4
1 1,1 1,2 1,3 1,4
2 2,1 2,2 2,3 2,4
3 3,1 3,2 3,4 3,4
4 4,1 4,2 4,4 4,4

 

Средние каждой из выборок и вероятность появления этого среднего представлены в виде таблицы:

 

 

Второе наблюдение

Первое наблюдение 1 2 3 4
1 1 (1/16) 1,5 (2/16) 2 (3/16) 2,5 (4/16)
2 1,5 (2/16) 2 (3/16) 2,5 (4/16) 3 (3/16)
3 2 (3/16) 2,5 (4/16) 3 (3/16) 3,5 (2/16)
4 2,5 (4/16) 3 (3/16) 3,5 (2/16) 4 (1/16)

Если среднее, например, 2,5, как видно их второй таблицы может появиться четыре раза, а всего выборок у нас 16, то вероятность его появления равна 4/16.

График вероятностного распределения средних выборок и график генеральной совокупности:

Теорема подтверждается: средние генеральной совокупности и выборочных средних совпадают и распределение выборочных средних приближено к нормальному.

μ = 2.5
μ = 2.5
Стандартное отклонение выборочных средних  будет являться ошибкой среднего.


Дата добавления: 2018-04-04; просмотров: 251; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!