Оценка истинного значения измеряемой величины.

Лекция 6. Статистические оценки параметров распределения. СТАТИСТИЧЕСКАЯ ПРОВЕРКА ГИПОТЕЗ

 

Точечные статистические оценки  являются случайными величинами, поэтому приближенная замена неизвестного параметра распределения  на  часто приводит к существенным ошибкам, особенно при малом объеме выборки. В этом случае применяют интервальные статистические оценки.

Интервальной называется оценка, которая определяется двумя числами – концами интервала, покрывающего оцениваемый параметр. Интервальные оценки позволяют установить точность и надежность оценок.

Разность между статистической оценкой  и оцениваемым ею параметром , взятая по абсолютной величине, называется точностью оценки, а именно

,                                                     (1)

где  – точность оценки.

Так как  – случайная величина, то и  будет случайной величиной, поэтому неравенство (1) выполняется с определенной вероятностью.

Вероятность, с которой берется неравенство (1), то есть

,                                           (2)

называется надежностью (доверительной вероятностью). Обычно надежность оценки задается наперед, причем в качестве  берут число, близкое к единице. Наиболее часто задают надежность, равную ;  и .

Равенство (2) можно записать так

,                                   (3)

Интервал , покрывающий оцениваемый параметр  генеральной совокупности с заданной надежностью , называют доверительным.

 

Доверительные интервалы для оценки математического ожидания  нормального распределения при известном среднем квадратическом отклонении .

 

Пусть количественный признак  генеральной совокупности распределен нормально, причем среднее квадратическое отклонение этого распределения известно. Требуется оценить неизвестное математическое ожидание  по выборочной средней . Найдем доверительные интервалы, покрывающие параметр  с надежностью .

Будем рассматривать выборочную среднюю  как случайную величину  (  изменяется от выборки к выборке) и выборочные значения признака , как одинаково распределенные независимые случайные величины  (эти числа также изменяются от выборки к выборке). Математическое ожидание каждой из этих величин равно  и среднее квадратическое отклонение – .

Если случайная величина  распределена нормально, то выборочная средняя , найденная по независимым наблюдениям, также распределена нормально. Параметры распределения  таковы

, .

Потребуем, чтобы выполнялось соотношение

,

где  – заданная надежность.

Пользуясь формулой

,

заменив  на  и  на , получим

,

где .

Найдя из последнего равенства , можем написать

,

Окончательно имеем

.   (4)

Смысл полученного соотношения таков: с надежностью  можно утверждать, что доверительный интервал  покрывает неизвестный параметр ; точность оценки . Число  можно определить из равенства  по таблице функции Лапласа.

Итак, поставленная задача решена.

Замечание 1. Оценку  называют классической. Из формулы , определяющей точность классической оценки, можно сделать следующие выводы:

1) при возрастании объема выборки  число  убывает и, следовательно, точность оценки увеличивается;

2) увеличение надежности оценки  приводит к увеличению  (  – возрастающая функция), а следовательно, и к возрастанию ; иными словами, увеличение надежности классической оценки влечет за собой уменьшение ее точности.

Замечание 2. Если требуется оценить математическое ожидание с наперед заданной точностью  и надежностью , то минимальный объем выборки, который обеспечит эту точность, находят по формуле

,

которая является следствием равенства .

 

Доверительные интервалы для оценки математического ожидания  нормального распределения при неизвестном среднем квадратическом отклонении .

 

Пусть количественный признак  генеральной совокупности распределен нормально, причем среднее квадратическое отклонение  этого распределения неизвестно. Требуется оценить неизвестное математическое ожидание  при помощи доверительных интервалов.

По данным выборки построим случайную величину

,

которая имеет распределение Стьюдента с  степенями свободы; здесь  – выборочная средняя,  – исправленное среднее квадратическое отклонение,  – объем выборки.

Дифференциальная функция

,

где .

Видно, что распределение Стьюдента определяется параметром  – объемом выборки (или, что то же, числом степеней свободы ) и не зависит от неизвестных параметров  и , что является его большим достоинством. Поскольку  – четная функция от , вероятность выполнения неравенства  определяется так

.

Заменив неравенство в круглых скобках равносильным ему двойным неравенством, получим

.                (5)

По заданным  и  можно найти табличное значение . Итак, доверительный интервал найден.

Замечание. Из предельных соотношений

,

следует, что при неограниченном возрастании объема выборки  распределение Стьюдента стремится к нормальному. Поэтому при  можно вместо распределения Стьюдента пользоваться нормальным распределением. Однако важно подчеркнуть, что для малых выборок ( ), замена распределения нормальным приводит к грубым ошибкам, а именно – к неоправданному сужению доверительного интервала, то есть к повышению точности оценки.

То обстоятельство, что распределение Стьюдента при малой выборке дает широкий доверительный интервал, вовсе не свидетельствует о слабости метода Стьюдента, а объясняется тем, что малая выборка, разумеется, содержит малую информацию об интересующем нас признаке.

 

Построение доверительного интервала для оценки математического ожидания с помощью неравенства Чебышева при заданной надежности .

 

В том случае, когда отсутствует информация о законе распределения признака генеральной совокупности , оценивание вероятности события , где , и построение доверительного интервала для  с заданной надежностью  производится с использованием неравенства Чебышева при условии, что известно значение , а именно

.                             (6)

Из (6) определяем величину

.                                                        (7)

Доверительный интервал задается таким неравенством

.             (8)

Когда  неизвестно, используем исправленное среднее квадратическое отклонение , а доверительный интервал имеет вид

.                  (9)

Пример. Получены данные со 100 наугад выбранных предприятий о возрастании выработки на одного работника  (в % относительно предыдущего года), которые имеют такое интервальное статистическое распределение

 

, %; 80 – 90 90 – 100 100 – 110 110 – 120 120 – 130
3 14 60 20 4

 

Используя неравенство Чебышева, построить доверительный интервал для , если известно значение  с надежностью .

Решение. Для построения доверительного интервала с помощью неравенства Чебышева необходимо вычислить  и . Чтобы определить , перейдем от интервального к дискретному статистическому распределению, а именно

 

85 95 105 115 125
3 14 60 20 4

 

Тогда имеем

.

.

Используя (13.7), вычислим

.

По формуле (13.8) находим доверительный интервал

;

.

 

Оценка истинного значения измеряемой величины.

 

Пусть производится  независимых равноточных измерений некоторой физической величины, истинное значение  которой неизвестно. Будем рассматривать результаты отдельных измерений как случайные величины . Эти величины независимы (измерения независимы), имеют одно и то же математическое ожидание  (истинное значение измеряемой величины), одинаковые дисперсии  (измерения равноточны) и распределены нормально (такое допущение подтверждается опытом). Таким образом, все предположения, сделанные при выводе доверительных интервалов в § 2 – 4, выполняются и, следовательно, можно использовать полученные в них формулы. То есть, истинное значение измеряемой величины можно оценивать по среднему арифметическому результатов отдельных измерений при помощи доверительных интервалов. Поскольку обычно  неизвестно, следует пользоваться формулами (13.5) и (13.9).

 

Доверительные интервалы для оценки среднего квадратического отклонения  нормального распределения.

 

Пусть количественный признак  генеральной совокупности распределен нормально. Требуется оценить неизвестное генеральное среднее квадратическое отклонение  по исправленному выборочному среднему квадратическому отклонению . Найдем доверительные интервалы, покрывающие параметр  с заданной надежностью .

Потребуем, чтобы выполнялось соотношение

или

.

Преобразуем двойное неравенство  в равносильное

.

Положив , получим

.                                     (10)

Необходимо найти . С этой целью введем в рассмотрение случайную величину

,

где  – объем выборки.

Дифференциальная функция распределения  имеет вид

,

Видно, что это распределение не зависит от оцениваемого параметра , а зависит только от объема выборки .

Преобразуем неравенство (10) так, чтобы оно приняло вид

.

Вероятность этого неравенства равна заданной надежности , то есть

.

Предполагая, что , перепишем неравенство (10) в виде

.

Умножив все члены неравенства на , получим

,

или

.

Вероятность того, что то неравенство, а следовательно, и равносильное ему неравенство (10) будет выполнено, равна

.

Из полученного уравнения можно по заданным  и  найти . Практически для отыскания  пользуются таблицей.

Вычислив по выборке  и найдя по таблице , получим искомый доверительный интервал (13.10), покрывающий  с заданной надежностью .

Замечание. Выше предполагалось, что . Если , то неравенство (10) примет вид (учитывая, что )

.                                                     (11)

 

Доверительные интервалы для оценки дисперсии  и среднего квадратического отклонения  нормального распределения.

 

Пусть количественный признак  генеральной совокупности распределен нормально. Доверительный интервал для параметра имеет вид

.                                   (12)

а для параметра  соответственно

.                                       (13)

Значения величин  и  находятся по таблице значений - распределения согласно равенствам

,                                               (14)

,                                                    (15)

где . Следует учитывать, что случайная величина  имеет - распределение с  степенью свободы.

 

Пример. Проверена партия однотипных телевизоров  на чувствительность к видеопрограммам . Данные проверки представлены дискретным статистическим рядом распределения

 

2 5 6 7 5 2 2 1
, мкв 200 250 300 350 400 450 500 550

 

С надежностью  построить доверительные интервалы для  и .

Решение. Для построения доверительных интервалов необходимо найти значения  и . Вычислим значение  и

.

.

;

.

Находим исправленную дисперсию и исправленное среднее квадратическое отклонение

.

.

Так как , то согласно (14) и (15) имеем

.

.

По таблице - распределения находим

.

По формулам (12) и (13) искомые доверительные интервалы

;

.

и

.

 

 


Дата добавления: 2020-11-27; просмотров: 164; Мы поможем в написании вашей работы!

Поделиться с друзьями:




Мы поможем в написании ваших работ!