Статистические оценки параметров распределения.
Пусть требуется изучить количественный признак генеральной совокупности. Допустим, удалось установить закон распределения этого признака. Возникает задача оценки параметров, которыми определяется это распределение. Например, изучаемый признак распределен в генеральной совокупности нормально. Тогда требуется оценить (приближенно найти) математическое ожидание и среднее квадратическое отклонение, так как эти два параметра полностью определяют нормальное распределение.
Обычно в распоряжении исследователя имеются лишь данные выборки, например, значения количественного признака x1, x2 … xn, полученные в результате n наблюдений. Через эти данные и выражают оцениваемый параметр. Найти статистическую оценку неизвестного параметра теоретического распределения – это значит найти функцию от наблюдаемых случайных величин, которая и даёт приближенное значение оцениваемого параметра.
Оценки генеральных параметров по выборочным характеристикам могут быть точечными и интервальными. Точечной называют оценку, которая определяется одним числом. Интервальной называют оценку, которая задается двумя числами – концами интервалов.
Для оценки неизвестных параметров теоретического распределения применяются характеристики статистического распределения выборки – выборочная средняя, выборочная дисперсия, выборочное среднее квадратическое отклонение. Это точечные оценки, вычисляемые по случайной выборке.
|
|
Выборочные характеристики как величины случайные, варьирующие вокруг своих генеральных параметров, в основном не совпадают с ними. Для того, чтобы оценки давали «хорошее» приближение оцениваемых параметров, они должны удовлетворять определённым требованиям: быть несмещёнными, эффективными и состоятельными.
Несмещенной называют статистическую оценку Θ*, математическое ожидание которой равно оцениваемому параметру Θ при любом объеме выборки, т.е. M(Θ*) = Θ.
Смещенной, если M(Θ*) ≠ Θ.
Эффективной называют статистическую оценку, которая (при заданном объеме выборки n) имеет наименьшую возможную дисперсию.
Состоятельной называют статистическую оценку, которая при n→∞ стремится по вероятности к оцениваемому параметру.
Оценка генеральной средней.
Теорема: Выборочная средняя повторной выборки есть несмещённая и состоятельная оценка генеральной средней , причем - дисперсия выборочной средней.
Выборочная средняя повторной выборки для нормально распределенной генеральной совокупности является эффективной оценкой генеральной средней
Определение:Среднее квадратическое отклонение выборочной средней называется стандартной ошибкой выборки
|
|
- стандартная ошибка выборки
Величину средней и её стандартную ошибку записывают так:
Ошибка средней арифметической может быть выражена в относительных величинах, т.е. в %. В этом случае её называют показателем точности и вычисляют по формуле:
Относительная ошибка выборки показывает, на сколько процентов выборочная оценка отклоняется от параметра генеральной совокупности.
Чем меньше величина , тем достовернее, надёжнее полученная средняя. Точность средней арифметической является приемлемой, если этот коэффициент не превышает 5%.
При выборке малого объема точечная оценка может разительно отличаться от оцениваемого параметра, т.е. приводить к грубым ошибкам.
По этой причине при небольшом объеме выборки следует пользоваться интервальными оценками.
Интервальные оценки позволяют установить точность и надежность оценок.
Пусть найденная по данным выборки статистическая характеристика Θ* служит оценкой неизвестного параметра Θ.
Если δ > 0 и │Θ – Θ*│< δ, то чем меньше δ, тем оценка точнее.
Т.о., положительное число δ характеризует точность оценки.
|
|
Однако статистические методы не позволяют категорически утверждать, что оценка Θ* удовлетворяет неравенству │Θ – Θ*│< δ; можно лишь говорить о вероятности , с которой это неравенство осуществляется.
Надежностью (доверительной вероятностью) оценки Θ по Θ* называют вероятность , с которой осуществляется неравенство │Θ – Θ*│< δ
= 0,95; 0,99; 0,999.
Заменив неравенство │Θ – Θ*│< δ равносильным ему двойным неравенством
Вероятность того, что интервал (Θ* - δ; Θ* + δ) заключает в себе (покрывает) неизвестный параметр Θ, равна .
Доверительным интервалом называется случайный интервал
(Θ*- δ; Θ*+ δ), в пределах которого с вероятностью находится неизвестный оцениваемый параметр.
Число называется доверительной вероятностью, уровнем доверия или надежностью оценки. Это значение задают заранее. Тогда, зная закон распределения случайной величины, можно найти доверительный интервал.
Число p(или ) называется уровнем значимости и показывает, с какой вероятностью заключение о надежности оценки ошибочно.
Его находят по формуле
.
Величина может иметь три значения: 0,95; 0,99; 0,999.
Соответственно p: 0,05; 0,01; 0,001.
|
|
Очевидно, что чем меньше p, тем точнее оценка.
На рис.16 показан геометрический смысл доверительной вероятности, уровня значимости и доверительного интервала. Длина доверительного интервала определяется % (значение доверительной вероятности, выраженной в процентах) площади под нормальной кривой выборочного распределения некоторой случайной величины. Уровень значимости соответствует той оставшейся части (в %) площади под нормально кривой, которая выходит за границы доверительного интервала.
Рис.16 Доверительный интервал, уровень значимости , доверительная вероятность для кривой нормального распределения.
Например, доверительная вероятность означает, что длина искомого доверительного интервала ограничивается 95% площади под кривой нормального распределения, т.е. полученная интервальная оценка справедлива для 95% членов генеральной совокупности. Оставшиеся 5% могут иметь отклонения от значений полученной оценки. С увеличением доверительной вероятности (уменьшением уровня значимости) увеличивается длина доверительного интервала.
Определение: наибольшее отклонение оценки от оцениваемого параметра в частности, выборочной средней ( или доли ) от генеральной средней ( или доли ), которое возможно с заданной доверительной вероятностью , называется предельной ошибкой выборки
Ошибка является ошибкой репрезентативности (представительности) выборки. Она возникает только вследствие того, что исследуется не вся совокупность, а лишь часть её (выборка), отобранная случайно.
Прежде, чем перейти к интервальным оценкам параметров распределения, рассмотрим некоторые важные распределения случайной величины.
Дата добавления: 2019-07-15; просмотров: 719; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!