Статистическое распределение выборки. Полигон и гистограмма.



 

Пусть из ген совокуп-ти извлечена выборка, причем х1 наблюдалось n1 раз, х2-n2 раз, xk-nk раз и СУММА ni=n – объем выборки. Наблюдаемые значения xi называются вариантами, а послед-ть вариант, записанных в возрастающем порядке – вариационным рядом. Числа наблюдений называют частотами, а их отношения к объему выборки n1/n=Wi – относительными частотами.

Статистическое распределение выборки – перечень вариант и соответствующих им частот или относительных частот. Стат распред-е можно задать также в виде послед-ти интервалов и соответствующих им частот (в кач-ве частоты, соответствующей интервалу, принимают сумму частот, попавших в этот интервал).

В теории в-ти под распред-ем понимают соответствие м/д возможными значениями СВ и их в-тями, а в мат статистике – соответствие м/д наблюдаемыми вариантами и их частотами или относит частотами.

ПОЛИГОН частот – ломаная, отрезки которой соединяют точки (x1; n1), (x2; n2),…, (xk; nk). Для построения полигона частот на оси абсцисс откладывают варианты xi, а на оси ординат – соответствующие им частоты (относит частоты).

Для того, чтобы определить вид з-ов распред-я, полигон частот сравнивают с графиками ф-ии плотности известных з-ов распред-я

ГРАФИКИ

 

В случае непрерывного признака целесообразно строить гистограмму, для чего интервал, в котором заключены все наблюдаемые значения признака, разбивают на несколько частичных интервалов длиной h и находят для каждого частичного интервала ni – сумму частот вариант, попавших в i-й интервал.

Гистограммой частот называется фигура, составленная из прямоугольников, площади которых равны частоте попадания значений признака в основание прямоугольника.

ГИСТОГРАММА – ступенчатая фигура, состоящая из прямоугольников, основаниями которых служат частичные интервалы длиною h, а высоты равны отношению ni/h (плотность частоты).

Для построения гистограммы частот на оси абсцисс откладывают частичные интервалы, а над ними проводят отрезки, ||ые оси абсцисс на расстоянии ni/h.

Площадь i-го частичного прямоугольника равна hni/h=ni – сумме частот вариант i-го интервала; => площадь гистограммы частот равна сумме всех частот, т.е. объему выборки. Площадь гистограммы относит частот равна сумме всех относит частот, т.е. единице.

 

Эмпирическая функция распределения, ее свойства.

 

Пусть задано стат распред-е частот колич-го признака Х, nx – число наблюдений, при котором значение признака X<x.

Эмпирическая ф-ия распред-я – ф-ия F*(x), определяющая относит частоту события, что X<x.

F*(x)= nx/n, где n – объем выборки.

СВОЙСТВА

1. Ф-ия неубывающая

2. Значения ф-ии 0<=F*(x)<=1

3. Если х1 – наименьшая варианта, то F*(x)=0 при x<=x1; если xk – наибольшая варианта, то F*(x)=1 при x>xk.

Эмпирическая ф-ия распред-я выборки служит для оценки теоретич ф-ии распред-я ген совокуп-ти.

ПРИМЕР xi-2-6-10 ni-12-18-30 n=12+18+30=60

Наименьшая варианта =2 => F*(x)=0 при x<2. Значение Х<6 (xi=2) наблюдалось 12 раз => F*(x)=12/60=0,2 при 2<x<6. Значение Х<10 (xi=2, 6) наблюдалось 12+18=30 раз => F*(x)=30/60=0,5 при 6<x<10. Так как х=10 – наибольшая варианта, то F*(x)=1 при x>10.

Искомая эмпирическая ф-ия F*(x)=СИСТЕМА (0, при x<2; 0,2 при 2<x<6; 0,5 при 6<x<10; 1 при x>10).

ГРАФИК

 

 

Статистические оценки параметров распределения. Несмещенные, эффективные и состоятельные оценки.

 

Пусть необходимо изучить количественный признак ген совокуп-ти. Допустим, удалось установить вид распределения, возникает задача оценки параметров данного распределения.

Статистической оценкой неизвестного параметра распределения называют ф-ию от наблюдаемых СВ

Пусть Q* - стат оценка неизвестного параметра, Q – оцениваемый параметр.

Для того, чтобы оценки давали хорошее приближение к оцениваемым параметрам они должны обладать следующими свойствами:

1. Несмещенная – стат оценка Q*, мат ожидание которой равно оцениваемому параметру Q при любом объеме выборки, т.е. M(Q*)=Q.

Смещенная – оценка, мат ожидание которой не равно оцениваемому параметру.

2. Эффективная – стат оценка, которая (при заданном объеме выборки n) имеет наименьшую дисперсию.

3. Состоятельная – оценка, которая при n -> к беск стремится по в-ти к оцениваемому параметру. НАПР., если дисперсия несмещенной оценки при n -> к беск стремится к 0, то такая оценка оказывается и состоятельной.

 

 


Дата добавления: 2018-05-13; просмотров: 458; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!