Понятие доверительных интервалов
Важно знать, насколько статистики выборки реально отображают параметры генеральной совокупности, а также утверждать с определенной вероятностью, что рассчитанный интервал выборки содержит требуемый нами параметр генеральной совокупности.
Например, вместо рассчитанного по выборке среднего значения средним мы можем говорить об интервале, a < μ < b, в котором с той или иной вероятностью будет содержаться наше среднее генеральной совокупности. Основной момент здесь заключается в том, что мы определяем среднее с какой-либо вероятностью, то есть строим доверительный интервал. Допустим, если мы с 95% вероятностью можем утверждать, что среднее совокупности лежит между 60 и 80, то, если сузим интервал, скажем, до 65 и 75, тогда вероятность того, что среднее попадет в данный интервал, будет, разумеется, меньше, соответственно, если расширим интервал – больше. Все сказанное можно представить в виде схемы:
В общих чертах можно представить соотношение среднего генеральной совокупности μ и среднего выборки в виде следующего равенства:
среднее выборки = среднее генеральной совокупности ± ошибка
= μ ± ошибка
То есть выборочное среднее отличается от среднего генеральной совокупности на число, именуемое ошибкой выборки или, наоборот 6
среднее генеральной совокупности = среднее выборки ± ошибка
Таким образом, для построения доверительного интервала необходимо определить ошибку выборки. Однако для каждого конкретного выборочного среднего ошибку знать невозможно, но мы можем узнать вероятность какой-либо заданной ошибки, если будем знать вероятностное распределение этих ошибок.
|
|
Итак, для генеральной совокупности возможен отбор некоторого количества выборок, для каждой из которых возможен расчет выборочного среднего значения:
Таким образом получаем распределение выборочных средних .
Центральная предельная теорема гласит о том, что если переменная X имеет распределение со средним m и стандартным отклонением d, то распределение выборочных средних случайных выборок также будет иметь среднее значение m и стандартное отклонение , которое определяется формулой:
где n-количество наблюдений выборки.
Такое распределение выборочных средних будет приближаться к нормальному при достаточно большом числе независимых наблюдений (обычно n>30).
Пример: генеральная совокупность состоит из четырех объектов: 1, 2, 3 и 4. Предположим, равную вероятность ј = 0,25 того, что мы «вытащим» из этой совокупности каждый объект. Мы должны сделать выборку из этой совокупности, состоящую из двух объектов. Количество возможных вариантов такой выборки равно 16. Все выборки можно представить в виде таблицы:
|
|
Первое наблюдение | Второе наблюдение | |||
1 | 2 | 3 | 4 | |
1 | 1,1 | 1,2 | 1,3 | 1,4 |
2 | 2,1 | 2,2 | 2,3 | 2,4 |
3 | 3,1 | 3,2 | 3,4 | 3,4 |
4 | 4,1 | 4,2 | 4,4 | 4,4 |
Средние каждой из выборок и вероятность появления этого среднего представлены в виде таблицы:
Второе наблюдение | ||||
Первое наблюдение | 1 | 2 | 3 | 4 |
1 | 1 (1/16) | 1,5 (2/16) | 2 (3/16) | 2,5 (4/16) |
2 | 1,5 (2/16) | 2 (3/16) | 2,5 (4/16) | 3 (3/16) |
3 | 2 (3/16) | 2,5 (4/16) | 3 (3/16) | 3,5 (2/16) |
4 | 2,5 (4/16) | 3 (3/16) | 3,5 (2/16) | 4 (1/16) |
Если среднее, например, 2,5, как видно их второй таблицы может появиться четыре раза, а всего выборок у нас 16, то вероятность его появления равна 4/16.
График вероятностного распределения средних выборок и график генеральной совокупности:
Теорема подтверждается: средние генеральной совокупности и выборочных средних совпадают и распределение выборочных средних приближено к нормальному.
|
|
Дата добавления: 2018-04-04; просмотров: 251; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!