Понятие доверительных интервалов

⇐ ПредыдущаяСтр 5 из 30Следующая ⇒

Важно знать, насколько статистики выборки реально отображают параметры генеральной совокупности, а также утверждать с определенной вероятностью, что рассчитанный интервал выборки содержит требуемый нами параметр генеральной совокупности.

Например, вместо рассчитанного по выборке среднего значения средним мы можем говорить об интервале, a < μ < b, в котором с той или иной вероятностью будет содержаться наше среднее генеральной совокупности. Основной момент здесь заключается в том, что мы определяем среднее с какой-либо вероятностью, то есть строим доверительный интервал. Допустим, если мы с 95% вероятностью можем утверждать, что среднее совокупности лежит между 60 и 80, то, если сузим интервал, скажем, до 65 и 75, тогда вероятность того, что среднее попадет в данный интервал, будет, разумеется, меньше, соответственно, если расширим интервал – больше. Все сказанное можно представить в виде схемы:

В общих чертах можно представить соотношение среднего генеральной совокупности μ и среднего выборки в виде следующего равенства:

среднее выборки = среднее генеральной совокупности ± ошибка

= μ ± ошибка

То есть выборочное среднее отличается от среднего генеральной совокупности на число, именуемое ошибкой выборки или, наоборот 6

среднее генеральной совокупности = среднее выборки ± ошибка

Таким образом, для построения доверительного интервала необходимо определить ошибку выборки. Однако для каждого конкретного выборочного среднего ошибку знать невозможно, но мы можем узнать вероятность какой-либо заданной ошибки, если будем знать вероятностное распределение этих ошибок.

Итак, для генеральной совокупности возможен отбор некоторого количества выборок, для каждой из которых возможен расчет выборочного среднего значения:

Таким образом получаем распределение выборочных средних .

Центральная предельная теорема гласит о том, что если переменная X имеет распределение со средним m и стандартным отклонением d, то распределение выборочных средних случайных выборок также будет иметь среднее значение m и стандартное отклонение , которое определяется формулой:

где n-количество наблюдений выборки.

Такое распределение выборочных средних будет приближаться к нормальному при достаточно большом числе независимых наблюдений (обычно n>30).

Пример: генеральная совокупность состоит из четырех объектов: 1, 2, 3 и 4. Предположим, равную вероятность ј = 0,25 того, что мы «вытащим» из этой совокупности каждый объект. Мы должны сделать выборку из этой совокупности, состоящую из двух объектов. Количество возможных вариантов такой выборки равно 16. Все выборки можно представить в виде таблицы:

Первое наблюдение	Второе наблюдение
Первое наблюдение	1	2	3	4
1	1,1	1,2	1,3	1,4
2	2,1	2,2	2,3	2,4
3	3,1	3,2	3,4	3,4
4	4,1	4,2	4,4	4,4

Средние каждой из выборок и вероятность появления этого среднего представлены в виде таблицы:

	Второе наблюдение
Первое наблюдение	1	2	3	4
1	1 (1/16)	1,5 (2/16)	2 (3/16)	2,5 (4/16)
2	1,5 (2/16)	2 (3/16)	2,5 (4/16)	3 (3/16)
3	2 (3/16)	2,5 (4/16)	3 (3/16)	3,5 (2/16)
4	2,5 (4/16)	3 (3/16)	3,5 (2/16)	4 (1/16)

Если среднее, например, 2,5, как видно их второй таблицы может появиться четыре раза, а всего выборок у нас 16, то вероятность его появления равна 4/16.

График вероятностного распределения средних выборок и график генеральной совокупности:

Теорема подтверждается: средние генеральной совокупности и выборочных средних совпадают и распределение выборочных средних приближено к нормальному.

μ = 2.5

Стандартное отклонение выборочных средних будет являться ошибкой среднего.

Дата добавления: 2018-04-04; просмотров: 251; Мы поможем в написании вашей работы!
Поделиться с друзьями:

⇐ Предыдущая 1 2 3 456 7 8 9 10 Следующая ⇒

Мы поможем в написании ваших работ!