Способ построения доверительных границ и интервалов



Для построения доверительного интервала (или границы) необходимо знать закон распределения статистики z = z( x1, ξ2... x n), по которой оценивается неизвестный параметр (такой статистикой могут быть сама оценка â(x1, ξ2...xn), статистика, от которой зависит оценка â, достаточная статистика или статистика, близкая к достаточной).

Один из способов построения состоит в следующем (проследим логику рассмотренного примера).

1) Построим случайную величину j = j(z, a), зависящую от статистики z и неизвестного параметра a таким образом, что:

— закон распределения для j известен и не зависит от a;

— j(z, a) непрерывна и монотонна по а.

Такая случайная величина j(z, a) называется центральной статистикой.

     2) Выберем интервал (f1, f2) для j так, чтобы попадание в него случайной величины j было практически достоверным (с вероятностью PД):

P{f1 <j(z, a) < f2}= PД,       (9)  

для чего достаточно в качестве f1 и f2 взять квантили распределения для j уровня (1-РД)/2 и (1+РД)/2 соответственно (рис. 6).

3) Перейдем в (9) к другой записи случайного события, разрешив неравенства относительно параметра a.

Рис. 6. Выбор интервалов

Предполагая монотонное возрастание j по а получим:

P{g(z, f1)< a < g(z, f2)} = PД.

Это соотношение верно при любом значении параметра a (поскольку это так для (9)), и потому, согласно определению, интервал со случайными концами (g(z, f1), g(z, f2)) является доверительным для a с уровнем доверия РД.

Если имеем монотонное убывание j по а, интервалом будет

(g(z, f2), g(z, f1)).

Замечания.

1. сделанное выше предположение о монотонности j(z, a) по а, не является существенным. В случае, если монотонности нет,

 Рис. 7. Доверительное множество при отсутствии монотонности

результатом разрешения неравенств в (9) под знаком вероятности относительно параметра a является не интервал, а более сложное доверительное множество, например, два интервала (рис. 7).

2. Если требуется построить одностороннюю доверительную границу (верхнюю или нижнюю), нужно использовать только одно из неравенств под знаком вероятности в (9). Используем

или P{j(z, a) > f1} = PД, f1=Q(1 - PД),

                          или     P{j(z, a) < f2} = PД ,  f2 = Q(PД),

согласовав знак неравенства с характером монотонности j по а (возрастание или убывание) и с характером границы (верхняя или нижняя). В неравенствах обозначено Q( P) — квантиль уровня P. После разрешения неравенства под знаком P получим односторонние доверительные границы для a.

3. О числовых значениях интервала. После применения формул для интервала, например, (8), к конкретным наблюдениям мы получаем конкретный интервал, например, для n = 9, при s = 1, РД= 0,95 (соответствующее значение fP = 1,96) и = 3,87 получаем по (8)

a1 = 3,22, a2 = 4,52.

Смысл замечания состоит в том, что нельзя писать аналогично соотношению (6)

,

поскольку под знаком вероятности нет случайного события. Параметр а не является случайной величиной, и интервал (3,22, 4,52) тоже не случайный, в отличие от формулы (6), где интервал является случайным. Коэффициент доверия РД= 0,95 — это характеристика способа определения интервала, но не конкретного полученного интервала.

4. О точности интервального оценивания (о ширине интервала (6)).

                                                             (6)

а) Ошибка оценивания d, в соответствии с (6),

d=

не превосходит значения  с вероятностью РД < 1. При массовых вычислениях подобного рода точность не хуже  в числе случаев, доля которых РД. Уровень доверия РДозначает, что правило определения интервала дает верный результат с вероятностью РД, которая обычно близка к единице, однако, единице не равна.

б) Хотелось бы иметь высокую точность с высокой вероятностью. Однако, при увеличении РД значение fp тоже увеличивается, так что с высокой вероятностью можно гарантировать относительно низкую точность —чем надежнее гарантия, тем меньше она гарантирует.

в) Связь точности с s и n: чем меньше s, тем выше точность. Увеличение n также улучшает точность, которая изменяется как . Чтобы повысить точность в 3 раза, нужно число наблюдений увеличить в 9 раз.

6.4. Интервалы для параметров нормального распределения

А. Распределение хи-квадрат c k степенями свободы. Для рассмотрения типичных практических примеров потребуются сведения о некоторых распределениях. Многие задачи статистики связаны с распределением хи-квадрат (χ2(k)).

Пусть a1, a2…ak — независимые случайные величины, распределенные по стандартному нормальному закону N(0,1). Рассмотрим сумму их квадратов и обозначим соответствующую случайную величину через :

.                                      (10)

Распределение этой случайной величины называют распределением хи-квадрат с k степенями свободы. Нетрудно показать (см., например, [2], §24), что плотность этого распределения выражается следующей формулой:

, x > 0,                                 (11)

где С k =  — нормирующий множитель,  — гамма-функция. На рис. 8 показаны графики при различных значениях k.

Рис. 8. Семейство плотностей распределения χ2

Заметим, что при k = 2 получаем показательное распределение:

.

Из соотношения (10) получаем первые два момента:

M  = k,   D  = 2k, (проверить!)

откуда ясно, что с увеличением числа k степеней свободы распределение c2(k) смещается вправо и расплывается, а также, что оно асимптотически нормально (в силу центральной предельной теоремы):

c2(k) ~ N(k, 2k) при k®¥;

при k > 30 можно пользоваться таблицами нормального распределения.

Далее отметим весьма полезные сведения.

Замечание. Это распределение c2 является частным случаем гамма-распределения, для которого плотность выражается формулой

p(x; l, a) = C(l, a) , x >0, l > 0, a > 0,

где C(l, a) = - нормирующий множитель; l – параметр формы, a – параметр масштаба,  - известная гамма-функция. Первые два момента m1 и s2 равны соответственно

m1 = l/a, s2 = l/a2.

Характеристическая функция f( t) этого распределения выражается формулой:

f( t)  =  = = . (12)

Если lцелое число, то распределение называется распределением Эрланга, которому подчиняется сумма l независимых случайных величин, показательно распределенных с плотностью .

Справедливость формулы (11) можно легко показать, определив характеристические функции для a12 и затем для . характеристическая функция для случайной величины  оказывается равной

(1–2it)-k/2,

откуда следует, что соответствующее распределение является гамма-распределением с параметрами l = k/2, a = 1/2.

 


Дата добавления: 2021-12-10; просмотров: 32; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!