Способ построения доверительных границ и интервалов
Для построения доверительного интервала (или границы) необходимо знать закон распределения статистики z = z( x1, ξ2... x n), по которой оценивается неизвестный параметр (такой статистикой могут быть сама оценка â(x1, ξ2...xn), статистика, от которой зависит оценка â, достаточная статистика или статистика, близкая к достаточной).
Один из способов построения состоит в следующем (проследим логику рассмотренного примера).
1) Построим случайную величину j = j(z, a), зависящую от статистики z и неизвестного параметра a таким образом, что:
— закон распределения для j известен и не зависит от a;
— j(z, a) непрерывна и монотонна по а.
Такая случайная величина j(z, a) называется центральной статистикой.
2) Выберем интервал (f1, f2) для j так, чтобы попадание в него случайной величины j было практически достоверным (с вероятностью PД):
P{f1 <j(z, a) < f2}= PД, (9)
для чего достаточно в качестве f1 и f2 взять квантили распределения для j уровня (1-РД)/2 и (1+РД)/2 соответственно (рис. 6).
3) Перейдем в (9) к другой записи случайного события, разрешив неравенства относительно параметра a.
Рис. 6. Выбор интервалов
Предполагая монотонное возрастание j по а получим:
P{g(z, f1)< a < g(z, f2)} = PД.
Это соотношение верно при любом значении параметра a (поскольку это так для (9)), и потому, согласно определению, интервал со случайными концами (g(z, f1), g(z, f2)) является доверительным для a с уровнем доверия РД.
|
|
Если имеем монотонное убывание j по а, интервалом будет
(g(z, f2), g(z, f1)).
Замечания.
1. сделанное выше предположение о монотонности j(z, a) по а, не является существенным. В случае, если монотонности нет,
Рис. 7. Доверительное множество при отсутствии монотонности
результатом разрешения неравенств в (9) под знаком вероятности относительно параметра a является не интервал, а более сложное доверительное множество, например, два интервала (рис. 7).
2. Если требуется построить одностороннюю доверительную границу (верхнюю или нижнюю), нужно использовать только одно из неравенств под знаком вероятности в (9). Используем
или P{j(z, a) > f1} = PД, f1=Q(1 - PД),
или P{j(z, a) < f2} = PД , f2 = Q(PД),
согласовав знак неравенства с характером монотонности j по а (возрастание или убывание) и с характером границы (верхняя или нижняя). В неравенствах обозначено Q( P) — квантиль уровня P. После разрешения неравенства под знаком P получим односторонние доверительные границы для a.
3. О числовых значениях интервала. После применения формул для интервала, например, (8), к конкретным наблюдениям мы получаем конкретный интервал, например, для n = 9, при s = 1, РД= 0,95 (соответствующее значение fP = 1,96) и = 3,87 получаем по (8)
|
|
a1 = 3,22, a2 = 4,52.
Смысл замечания состоит в том, что нельзя писать аналогично соотношению (6)
,
поскольку под знаком вероятности нет случайного события. Параметр а не является случайной величиной, и интервал (3,22, 4,52) тоже не случайный, в отличие от формулы (6), где интервал является случайным. Коэффициент доверия РД= 0,95 — это характеристика способа определения интервала, но не конкретного полученного интервала.
4. О точности интервального оценивания (о ширине интервала (6)).
(6)
а) Ошибка оценивания d, в соответствии с (6),
d=
не превосходит значения с вероятностью РД < 1. При массовых вычислениях подобного рода точность не хуже в числе случаев, доля которых РД. Уровень доверия РДозначает, что правило определения интервала дает верный результат с вероятностью РД, которая обычно близка к единице, однако, единице не равна.
б) Хотелось бы иметь высокую точность с высокой вероятностью. Однако, при увеличении РД значение fp тоже увеличивается, так что с высокой вероятностью можно гарантировать относительно низкую точность —чем надежнее гарантия, тем меньше она гарантирует.
|
|
в) Связь точности с s и n: чем меньше s, тем выше точность. Увеличение n также улучшает точность, которая изменяется как . Чтобы повысить точность в 3 раза, нужно число наблюдений увеличить в 9 раз.
6.4. Интервалы для параметров нормального распределения
А. Распределение хи-квадрат c k степенями свободы. Для рассмотрения типичных практических примеров потребуются сведения о некоторых распределениях. Многие задачи статистики связаны с распределением хи-квадрат (χ2(k)).
Пусть a1, a2…ak — независимые случайные величины, распределенные по стандартному нормальному закону N(0,1). Рассмотрим сумму их квадратов и обозначим соответствующую случайную величину через :
. (10)
Распределение этой случайной величины называют распределением хи-квадрат с k степенями свободы. Нетрудно показать (см., например, [2], §24), что плотность этого распределения выражается следующей формулой:
, x > 0, (11)
где С k = — нормирующий множитель, — гамма-функция. На рис. 8 показаны графики при различных значениях k.
Рис. 8. Семейство плотностей распределения χ2
Заметим, что при k = 2 получаем показательное распределение:
|
|
.
Из соотношения (10) получаем первые два момента:
M = k, D = 2k, (проверить!)
откуда ясно, что с увеличением числа k степеней свободы распределение c2(k) смещается вправо и расплывается, а также, что оно асимптотически нормально (в силу центральной предельной теоремы):
c2(k) ~ N(k, 2k) при k®¥;
при k > 30 можно пользоваться таблицами нормального распределения.
Далее отметим весьма полезные сведения.
Замечание. Это распределение c2 является частным случаем гамма-распределения, для которого плотность выражается формулой
p(x; l, a) = C(l, a) , x >0, l > 0, a > 0,
где C(l, a) = - нормирующий множитель; l – параметр формы, a – параметр масштаба, - известная гамма-функция. Первые два момента m1 и s2 равны соответственно
m1 = l/a, s2 = l/a2.
Характеристическая функция f( t) этого распределения выражается формулой:
f( t) = = = . (12)
Если l — целое число, то распределение называется распределением Эрланга, которому подчиняется сумма l независимых случайных величин, показательно распределенных с плотностью .
Справедливость формулы (11) можно легко показать, определив характеристические функции для a12 и затем для . характеристическая функция для случайной величины оказывается равной
(1–2it)-k/2,
откуда следует, что соответствующее распределение является гамма-распределением с параметрами l = k/2, a = 1/2.
Дата добавления: 2021-12-10; просмотров: 32; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!