Статистические оценки параметров распределения.



    Пусть требуется изучить количественный признак генеральной совокупности. Допустим, удалось установить закон распределения этого признака. Возникает задача оценки параметров, которыми определяется это распределение. Например, изучаемый признак распределен в генеральной совокупности нормально. Тогда требуется оценить (приближенно найти) математическое ожидание и среднее квадратическое отклонение, так как эти два параметра полностью определяют нормальное распределение.

    Обычно в распоряжении исследователя имеются лишь данные выборки, например, значения количественного признака x1, x2 … xn, полученные в результате n наблюдений. Через эти данные и выражают оцениваемый параметр. Найти статистическую оценку неизвестного параметра теоретического распределения – это значит найти функцию от наблюдаемых случайных величин, которая и даёт приближенное значение оцениваемого параметра.

    Оценки генеральных параметров по выборочным характеристикам могут быть точечными и интервальными. Точечной называют оценку, которая определяется одним числом. Интервальной называют оценку, которая задается двумя числами – концами интервалов.

    Для оценки неизвестных параметров теоретического распределения применяются характеристики статистического распределения выборки – выборочная средняя, выборочная дисперсия, выборочное среднее квадратическое отклонение. Это точечные оценки, вычисляемые по случайной выборке.

    Выборочные характеристики как величины случайные, варьирующие вокруг своих генеральных параметров, в основном не совпадают с ними. Для того, чтобы оценки давали «хорошее» приближение оцениваемых параметров, они должны удовлетворять определённым требованиям: быть несмещёнными, эффективными и состоятельными.

Несмещенной называют статистическую оценку Θ*, математическое ожидание которой равно оцениваемому параметру Θ при любом объеме выборки, т.е. M(Θ*) = Θ.

Смещенной, если M(Θ*) ≠ Θ.

Эффективной называют статистическую оценку, которая (при заданном объеме выборки n) имеет наименьшую возможную дисперсию.

Состоятельной называют статистическую оценку, которая при n→∞ стремится по вероятности к оцениваемому параметру.

Оценка генеральной средней.

Теорема: Выборочная средняя  повторной выборки есть несмещённая и состоятельная оценка генеральной средней , причем  - дисперсия выборочной средней.

Выборочная средняя  повторной выборки для нормально распределенной генеральной совокупности является эффективной оценкой генеральной средней  

Определение:Среднее квадратическое отклонение выборочной средней  называется стандартной ошибкой выборки

 - стандартная ошибка выборки

Величину средней и её стандартную ошибку записывают так:

Ошибка средней арифметической может быть выражена в относительных величинах, т.е. в %. В этом случае её называют показателем точности  и вычисляют по формуле:

 

 

 


    Относительная ошибка выборки показывает, на сколько процентов выборочная оценка отклоняется от параметра генеральной совокупности.

    Чем меньше величина , тем достовернее, надёжнее полученная средняя. Точность средней арифметической является приемлемой, если этот коэффициент не превышает 5%.

При выборке малого объема точечная оценка может разительно отличаться от оцениваемого параметра, т.е. приводить к грубым ошибкам.

По этой причине при небольшом объеме выборки следует пользоваться интервальными оценками.

Интервальные оценки позволяют установить точность и надежность оценок.

Пусть найденная по данным выборки статистическая характеристика Θ* служит оценкой неизвестного параметра Θ.

Если δ > 0 и │Θ – Θ*│< δ, то чем меньше δ, тем оценка точнее.

Т.о., положительное число δ характеризует точность оценки.

Однако статистические методы не позволяют категорически утверждать, что оценка Θ* удовлетворяет неравенству │Θ – Θ*│< δ; можно лишь говорить о вероятности , с которой это неравенство осуществляется.

Надежностью (доверительной вероятностью) оценки Θ по Θ* называют вероятность , с которой осуществляется неравенство │Θ – Θ*│< δ

 = 0,95; 0,99; 0,999.

Заменив неравенство │Θ – Θ*│< δ равносильным ему двойным неравенством

Вероятность того, что интервал (Θ* - δ; Θ* + δ) заключает в себе (покрывает) неизвестный параметр Θ, равна .

Доверительным интервалом называется случайный интервал

*- δ; Θ*+ δ), в пределах которого с вероятностью  находится неизвестный оцениваемый параметр.

Число  называется доверительной вероятностью, уровнем доверия или надежностью оценки. Это значение задают заранее. Тогда, зная закон распределения случайной величины, можно найти доверительный интервал.

Число p(или ) называется уровнем значимости и показывает, с какой вероятностью заключение о надежности оценки ошибочно.

Его находят по формуле

.

Величина  может иметь три значения: 0,95; 0,99; 0,999.

Соответственно p: 0,05; 0,01; 0,001.

Очевидно, что чем меньше p, тем точнее оценка.

На рис.16 показан геометрический смысл доверительной вероятности, уровня значимости и доверительного интервала. Длина доверительного интервала определяется % (значение доверительной вероятности, выраженной в процентах) площади под нормальной кривой выборочного распределения некоторой случайной величины. Уровень значимости  соответствует той оставшейся части (в %) площади под нормально кривой, которая выходит за границы доверительного интервала.

 

 

Рис.16 Доверительный интервал, уровень значимости , доверительная вероятность  для кривой нормального распределения.

Например, доверительная вероятность  означает, что длина искомого доверительного интервала ограничивается 95% площади под кривой нормального распределения, т.е. полученная интервальная оценка справедлива для 95% членов генеральной совокупности. Оставшиеся 5% могут иметь отклонения от значений полученной оценки. С увеличением доверительной вероятности (уменьшением уровня значимости) увеличивается длина доверительного интервала.

Определение: наибольшее отклонение  оценки  от оцениваемого параметра  в частности, выборочной средней ( или доли ) от генеральной средней ( или доли ), которое возможно с заданной доверительной вероятностью , называется предельной ошибкой выборки

Ошибка  является ошибкой репрезентативности (представительности) выборки. Она возникает только вследствие того, что исследуется не вся совокупность, а лишь часть её (выборка), отобранная случайно.

Прежде, чем перейти к интервальным оценкам параметров распределения, рассмотрим некоторые важные распределения случайной величины.

 


Дата добавления: 2019-07-15; просмотров: 719; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!