Статистические оценки параметров распределения.

⇐ ПредыдущаяСтр 9 из 20Следующая ⇒

Пусть требуется изучить количественный признак генеральной совокупности. Допустим, удалось установить закон распределения этого признака. Возникает задача оценки параметров, которыми определяется это распределение. Например, изучаемый признак распределен в генеральной совокупности нормально. Тогда требуется оценить (приближенно найти) математическое ожидание и среднее квадратическое отклонение, так как эти два параметра полностью определяют нормальное распределение.

Обычно в распоряжении исследователя имеются лишь данные выборки, например, значения количественного признака x₁, x₂ … x_n, полученные в результате n наблюдений. Через эти данные и выражают оцениваемый параметр. Найти статистическую оценку неизвестного параметра теоретического распределения – это значит найти функцию от наблюдаемых случайных величин, которая и даёт приближенное значение оцениваемого параметра.

Оценки генеральных параметров по выборочным характеристикам могут быть точечными и интервальными. Точечной называют оценку, которая определяется одним числом. Интервальной называют оценку, которая задается двумя числами – концами интервалов.

Для оценки неизвестных параметров теоретического распределения применяются характеристики статистического распределения выборки – выборочная средняя, выборочная дисперсия, выборочное среднее квадратическое отклонение. Это точечные оценки, вычисляемые по случайной выборке.

Выборочные характеристики как величины случайные, варьирующие вокруг своих генеральных параметров, в основном не совпадают с ними. Для того, чтобы оценки давали «хорошее» приближение оцениваемых параметров, они должны удовлетворять определённым требованиям: быть несмещёнными, эффективными и состоятельными.

Несмещенной называют статистическую оценку Θ^*, математическое ожидание которой равно оцениваемому параметру Θ при любом объеме выборки, т.е. M(Θ^*) = Θ.

Смещенной, если M(Θ^*) ≠ Θ.

Эффективной называют статистическую оценку, которая (при заданном объеме выборки n) имеет наименьшую возможную дисперсию.

Состоятельной называют статистическую оценку, которая при n→∞ стремится по вероятности к оцениваемому параметру.

Оценка генеральной средней.

Теорема: Выборочная средняя повторной выборки есть несмещённая и состоятельная оценка генеральной средней , причем - дисперсия выборочной средней.

Выборочная средняя повторной выборки для нормально распределенной генеральной совокупности является эффективной оценкой генеральной средней

Определение:Среднее квадратическое отклонение выборочной средней называется стандартной ошибкой выборки

- стандартная ошибка выборки

Величину средней и её стандартную ошибку записывают так:

Ошибка средней арифметической может быть выражена в относительных величинах, т.е. в %. В этом случае её называют показателем точности и вычисляют по формуле:

Относительная ошибка выборки показывает, на сколько процентов выборочная оценка отклоняется от параметра генеральной совокупности.

Чем меньше величина , тем достовернее, надёжнее полученная средняя. Точность средней арифметической является приемлемой, если этот коэффициент не превышает 5%.

При выборке малого объема точечная оценка может разительно отличаться от оцениваемого параметра, т.е. приводить к грубым ошибкам.

По этой причине при небольшом объеме выборки следует пользоваться интервальными оценками.

Интервальные оценки позволяют установить точность и надежность оценок.

Пусть найденная по данным выборки статистическая характеристика Θ^* служит оценкой неизвестного параметра Θ.

Если δ > 0 и │Θ – Θ^*│< δ, то чем меньше δ, тем оценка точнее.

Т.о., положительное число δ характеризует точность оценки.

Однако статистические методы не позволяют категорически утверждать, что оценка Θ^* удовлетворяет неравенству │Θ – Θ^*│< δ; можно лишь говорить о вероятности , с которой это неравенство осуществляется.

Надежностью (доверительной вероятностью) оценки Θ по Θ^* называют вероятность , с которой осуществляется неравенство │Θ – Θ^*│< δ

= 0,95; 0,99; 0,999.

Заменив неравенство │Θ – Θ^*│< δ равносильным ему двойным неравенством

Вероятность того, что интервал (Θ^* - δ; Θ^* + δ) заключает в себе (покрывает) неизвестный параметр Θ, равна .

Доверительным интервалом называется случайный интервал

(Θ^*- δ; Θ^*+ δ), в пределах которого с вероятностью находится неизвестный оцениваемый параметр.

Число называется доверительной вероятностью, уровнем доверия или надежностью оценки. Это значение задают заранее. Тогда, зная закон распределения случайной величины, можно найти доверительный интервал.

Число p(или ) называется уровнем значимости и показывает, с какой вероятностью заключение о надежности оценки ошибочно.

Его находят по формуле

Величина может иметь три значения: 0,95; 0,99; 0,999.

Соответственно p: 0,05; 0,01; 0,001.

Очевидно, что чем меньше p, тем точнее оценка.

На рис.16 показан геометрический смысл доверительной вероятности, уровня значимости и доверительного интервала. Длина доверительного интервала определяется % (значение доверительной вероятности, выраженной в процентах) площади под нормальной кривой выборочного распределения некоторой случайной величины. Уровень значимости соответствует той оставшейся части (в %) площади под нормально кривой, которая выходит за границы доверительного интервала.

Рис.16 Доверительный интервал, уровень значимости , доверительная вероятность для кривой нормального распределения.

Например, доверительная вероятность означает, что длина искомого доверительного интервала ограничивается 95% площади под кривой нормального распределения, т.е. полученная интервальная оценка справедлива для 95% членов генеральной совокупности. Оставшиеся 5% могут иметь отклонения от значений полученной оценки. С увеличением доверительной вероятности (уменьшением уровня значимости) увеличивается длина доверительного интервала.

Определение: наибольшее отклонение оценки от оцениваемого параметра в частности, выборочной средней ( или доли ) от генеральной средней ( или доли ), которое возможно с заданной доверительной вероятностью , называется предельной ошибкой выборки

Ошибка является ошибкой репрезентативности (представительности) выборки. Она возникает только вследствие того, что исследуется не вся совокупность, а лишь часть её (выборка), отобранная случайно.

Прежде, чем перейти к интервальным оценкам параметров распределения, рассмотрим некоторые важные распределения случайной величины.

Дата добавления: 2019-07-15; просмотров: 742; Мы поможем в написании вашей работы!

Поделиться с друзьями:

⇐ Предыдущая 4 5 6 7 8910 11 12 13 Следующая ⇒

Мы поможем в написании ваших работ!