Статистические оценки параметров распределения. Точечные оценки.



Элементы математической статистики

§ 1. Основные понятия математической статистики   (Генеральная совокупность и выборка. Вариационный ряд, статистический ряд. Группированная выборка. Группированный статистический ряд. Полигон частот. Выборочная функция распределения и гистограмма)

   Математическая статистика занимается установлением закономерностей, которым подчинены массовые случайные явления, на основе обработки статистических данных, полученных в результате наблюдений. Двумя основными задачами математической статистики являются:

- определение способов сбора и группировки этих статистических данных;

- разработка методов анализа полученных данных в зависимости от целей исследования, к которым относятся:

а) оценка неизвестной вероятности события; оценка неизвестной функции распределения; оценка параметров распределения, вид которого известен; оценка зависимости от других случайных величин и т.д.;

б) проверка статистических гипотез о виде неизвестного распределения или о значениях параметров известного распределения.

  Для решения этих задач необходимо выбрать из большой совокупности однородных объектов ограниченное количество объектов, по результатам изучения которых можно сделать прогноз относительно исследуемого признака этих объектов.

   Определим основные понятия математической статистики.

Генеральная совокупность– это множество всех имеющихся однородных объектов.

Выборочная совокупность или выборка – набор объектов, случайно отобранных из генеральной совокупности.

Объем генеральной совокупности N и объем выборки n – число объектов в рассматриваемой совокупности.

 

 

Виды выборок:

Повторная – каждый отобранный объект перед выбором следующего возвращается в генеральную совокупность;

Бесповторная – отобранный объект в генеральную совокупность не возвращается.

На практике чаще используется бесповторная выборка.

Замечание.

Для того, чтобы по исследованию выборки можно было сделать выводы о поведении интересующего признака генеральной совокупности, нужно, чтобы выборка правильно представляла пропорции генеральной совокупности, то есть была репрезентативной (представительной). Учитывая закон больших чисел, можно утверждать, что это условие выполняется, если каждый объект выбран случайно, причем для любого объекта вероятность попасть в выборку одинакова.

                      Первичная обработка результатов

Пусть интересующая нас случайная величина Х принимает в выборке значение х1 - п1 раз, х2п2 раз, …, хк – пк раз, причем  где п – объем выборки.

Тогда наблюдаемые значения случайной величины х1, х2,…, хк  называют вариантами, а п1, п2,…, пкчастотами.

Если разделить каждую частоту на объем выборки, то получим относительные частоты  

Последовательность вариант, записанных в порядке возрастания, называют вариационным рядом, а перечень вариант и соответствующих им частот или относительных частот – статистическим рядом:

 

 

     xi        x1      x2     …       xk
     ni        n1      n2     …       nk
     wi        w1      w2     …      wk

 

Пример

   При проведении 20 серий из 10 бросков игральной кости число выпадений шести очков оказалось равным 1,1,4,0,1,2,1,2,2,0,5,3,3,1,0,2,2,3,4,1.Составим вариационный ряд: 0,1,2,3,4,5. Статистический ряд для абсолютных и относительных частот имеет вид:

  xi 0    1   2   3   4   5
   ni 3    6 5   3   2   1
   wi 0,15   0,3 0,25 0,15 0,1 0,05

 

Если исследуется некоторый непрерывный признак, то вариационный ряд может состоять из очень большого количества чисел. В этом случае удобнее использовать группированную выборку. Для ее получения интервал, в котором заключены все наблюдаемые значения признака, разбивают на несколько равных частичных интервалов длиной h, а затем находят для каждого частичного интервала ni – сумму частот вариант, попавших в i-й интервал. Составленная по этим результатам таблица называется группированным статистическим рядом (или интервальным вариационным рядом):

Номера интервалов    1     2      …         k
Границы интервалов (a, a + h) (a + h, a + 2h)       … (b – h, b)
Сумма частот вариант, попав- ших в интервал                 n1       n2          …       nk

 

 

  Для наглядного представления о поведении исследуемой случайной величины в выборке можно строить различные графики. Один из них – полигон частот: ломаная, отрезки которой соединяют точки с координатами (x1, n1), (x2, n2),…, (xk , nk), где xi откладываются на оси абсцисс, а ni – на оси ординат.

Если на оси ординат откладывать не абсолютные (ni), а относительные (wi) частоты, то получим полигон относительных частот (рис.1). Рис. 1.

 

  Для непрерывного признака графической иллюстрацией служит гистограмма, то есть ступенчатая фигура, состоящая из прямоугольников, основаниями которых служат частичные интервалы длиной h, а высотами отрезки длиной ni / h (гистограмма частот) или wi / h (гистограмма относительных частот). В первом случае площадь гистограммы равна объему

выборки, во втором – единице (рис.2). Рис.2.

 

 

По аналогии с функцией распределения случайной величины задается  функция, определяющая относительную частоту события X < x .

Определение 1.Эмпирической  (выборочной) функцией распределения называют функцию F *(x), определяющую для каждого значения х относительную частоту события X < x :

                                            ,                                                     (1)

где пх – число вариант, меньших х, п – объем выборки.

 

Замечание. В отличие от эмпирической функции распределения, найденной опытным путем, функцию распределения F(x) генеральной совокупности называют теоретической функцией распределения. F(x) определяет вероятность события X < x, а F *(x) – его относительную частоту. При достаточно больших п, как следует из теоремы Бернулли, F *(x) стремится по вероятности к F(x).

 

Из определения эмпирической функции распределения видно, что ее свойства совпадают со свойствами F(x), а именно:

1) 0 ≤ F *(x) ≤ 1.

2) F *(x) – неубывающая функция.

3) Если х1 – наименьшая варианта, то F *(x) = 0 при хх1; если хк – наибольшая варианта, то F *(x) = 1 при х > хк .

4) Функция F *(x) непрерывна слева.

 

Статистические оценки параметров распределения. Точечные оценки.

Предположим, что требуется определить количественный признак генеральной совокупности (например, порог ощущения в опытах). В распоряжении исследователя имеются лишь данные выборки (x ,x , ,x ), полученные в результате n наблюдений.

Через эти данные и выражают исследуемый параметр с помощью однозначно определенной функции, называемой оценкой или статистикой параметра.

Существуют два рода оценок:

- точечные, когда неизвестный параметр Θ характеризуется приближенным значением Θ*;

- интервальные, когда неизвестный параметр характеризуется интервалом возможных значений.

Рассмотрим точечные оценки.

I Основные определения

Пусть Θ* - статистическая оценка неизвестного параметра Θ теоретического распределения. Извлечем из генеральной совокупности несколько выборок одного и того же объема п и вычислим для каждой из них оценку параметра Θ:  Тогда оценку Θ* можно рассматривать как случайную величину, принимающую возможные значения  

Если математическое ожидание Θ* не равно оцениваемому параметру, мы будем получать при вычислении оценок систематические ошибки одного знака (с избытком, если М( Θ*) >Θ, и с недостатком, если М(Θ*) < Θ). Следовательно, необходимым условием отсутствия систематических ошибок является требование М(Θ*) = Θ.

Определение1.Статистическая оценка Θ* называется несмещенной, если ее математическое ожидание равно оцениваемому параметруΘ при любом объеме выборки:

                                                    М(Θ*)=Θ.                                                     (1)

Смещенной называют оценку, математическое ожидание которой не равно оцениваемому параметру.

Однако несмещенность не является достаточным условием хорошего приближения к истинному значению оцениваемого параметра. Если при этом возможные значения Θ* могут значительно отклоняться от среднего значения, то есть дисперсия Θ* велика, то значение, найденное по данным одной выборки, может значительно отличаться от оцениваемого параметра. Следовательно, требуется наложить ограничения на дисперсию.

Определение 2. Статистическая оценка называется эффективной, если она при заданном объеме выборки п имеет наименьшую возможную дисперсию.

При рассмотрении выборок большого объема к статистическим оценкам предъявляется также требование состоятельности.

Определение 3.Состоятельной называется статистическая оценка, которая при п→∞ стремится по вероятности к оцениваемому параметру.

Если эта оценка несмещенная, то она будет состоятельной, если при п→∞ ее дисперсия стремится к 0.


Дата добавления: 2019-02-22; просмотров: 325; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!