Эмпирическая функция распределения

Статистическое распределение выборки

Пусть из генеральной совокупности извлечена выборка, причем значение x1–наблюдалось раз, x2-n2 раз,… xk - nk раз. n = n1+n2+...+nk– объем выборки. Наблюдаемые значения называются вариантами, а последовательность вариант, записанных в возрастающем порядке- вариационным рядом. Числа наблюдений называются частотами (абсолютными частотами), а их отношения к объему выборки - относительными частотами или статистическими вероятностями.

Если количество вариант велико или выборка производится из непрерывной генеральной совокупности, то вариационный ряд составляется не по отдельным точечным значениям, а по интервалам значений генеральной совокупности. Такой вариационный ряд называется интервальным. Длины интервалов при этом должны быть равны.

Статистическим распределением выборки называется перечень вариант и соответствующих им частот или относительных частот.

Статистическое распределение можно задать также в виде последовательности интервалов и соответствующих им частот (суммы частот, попавших в этот интервал значений)

Точечный вариационный ряд частот может быть представлен таблицей:

xi x1 x2 xk
ni n1 n2 nk

Аналогично можно представить точечный вариационный ряд относительных частот.

Пример:

Число букв в некотором тексте Х оказалось равным 1000. Первой встретилась буква «я», второй- буква «и», третьей- буква «а», четвертой- «ю». Затем шли буквы «о», «е», «у», «э», «ы».

Выпишем места, которые они занимают в алфавите, соответственно имеем: 33, 10, 1, 32, 16, 6, 21, 31, 29.

После упорядочения этих чисел по возрастанию получаем вариационный ряд: 1, 6, 10, 16, 21, 29, 31, 32, 33.

Частоты появления букв в тексте: «а» - 75, «е» -87, «и»- 75, «о»- 110, «у»- 25, «ы»- 8, «э»- 3, «ю»- 7, «я»- 22.

Составим точечный вариационный ряд частот:

Пример:

Задано распределение частот выборки объема n = 20.

Составьте точечный вариационный ряд относительных частот.

xi 2 6 12
ni 3 10 7

Решение:

Найдем относительные частоты:

xi 2 6 12
wi 0,15 0,5 0,35

 

При построении интервального распределения существуют правила выбора числа интервалов или величины каждого интервала. Критерием здесь служит оптимальное соотношение: при увеличении числа интервалов улучшается репрезентативность, но увеличивается объем данных и время на их обработку. Разность xmax - xmin между наибольшим и наименьшим значениями вариант называют размахом выборки.

Для подсчета числа интервалов k обычно применяют эмпирическую формулу Стреджесса (подразумевая округление до ближайшего удобного целого): k = 1 + 3.322 lg n.

Соответственно, величину каждого интервала h можно вычислить по формуле :

 

 

 

Эмпирическая функция распределения

Эмпирической (опытной) функцией распределения или функцией распределения выборки называют такую функцию, которая определяет для каждого значения x частоту событий X<x и предназначена для оценке теоретической функции распределения генеральной совокупности в математической статистике.

Эмпирическая функция распределения находится по формуле:

n — объем выборки;

nx — количество наблюдений (вариантов) меньше x.

Пример

Дана таблица функции распределения выборки. Требуется построить эмпирическую функцию распределения

xi 1 2 3 4 5 6
ni 4 10 6 8 7 5

Решение

Из таблицы n=40, т.е.
n=4+10+6+8+7+5=40
Вычислим функцию распределения выборки

Эмпирическая функция распределения имеет вид

Построим график кусочно-постоянной эмпирической функции распределения

таким образом, по данным выборки можно приближенно построить функцию для неизвестной функции выборки.

 


Дата добавления: 2021-01-20; просмотров: 130; Мы поможем в написании вашей работы!

Поделиться с друзьями:




Мы поможем в написании ваших работ!