Эмпирическая функция распределения



Пусть пх — число наблюдений, при которых значение признака X меньше х. При объеме выборки, равном п, относитель­ная частота события X < x равна nх/n.

Определение 8. Функция F *( x ) = nx / n , (15.49)

определяющая для каждого значения х относительную частоту события X < х, называется эмпирической функцией распреде­ления или функцией распределения выборки.

В отличие от эмпирической функции распределения F *( x ) выборки функция распределения F ( x ) генеральной совокупно­сти называется теоретической функцией распределения. Раз­личие между ними состоит в том, что функция F ( x ) опреде­ляет вероятность события X < х, a F *( x ) — относительную частоту этого события. Из теоретических результатов общей теории вероятностей (закон больших чисел) следует, что при больших п вероятность отличия этих функций друг от друга близка к единице:

Нетрудно видеть, что F *( x ) обладает всеми свойствами F ( x ), что вытекает из ее определения (15.49):

• значения F *(х) принадлежат отрезку [0,1];

F *( x ) является неубывающей функцией;

• если х1 — наименьшая варианта, то F *( x ) = 0 при х ≤ x 1;

• если хк — максимальная варианта, то F *( x ) = 1 при х > хк.

 

Сама же функция F *( x ) служит для оценки теоретической функции распределения F ( x ) генеральной совокупности.

Пример 3. Построить эмпирическую функцию по заданному распределению выборки:

Решение. Находим объем выборки: п =10 +15 + 25 = 50. Наименьшая варианта равна 2, поэтому F *( x ) = 0 при х ≤ 2. Значение X < 4 (или х1 = 2) наблюдалось 10 раз, значит, F (x) = 10/50 = 0,2 при 2 < х < 4. Значения X < 6 (а именно х1 = 2 и x2 =4) наблюдались 10 + 15 = 25 раз, значит, при 4 < x < 6 функция F *( x ) = 25/50 = 0,5.    Поскольку X= 6 – максимальная варианта, то F *( x )= 1 при х>6.    Напишем формулу искомой эмпирической функции:

График этой функции показан на рисунке 15.8

Полигон и гистограмма

Каждую пару значений i , ni ) из распределения выбор­ки можно трактовать как точку на координатной плоскости. Точно так же можно рассматривать и пары значений (xi, Wi ) относительного распределения выборки.                  Ломаная, отрезки ко­торой соединяют точки (х i , ni ), называется полигоном частот.

Ломаная, соединяющая на координатной плоскости точки (xi , Wi), называется полигоном относительных частот. На рис. 15.9 показан полигон относительных частот для распре­деления, приведенного в примере 2.

Для случая непрерывного признака X удобно разбить ин­тервал ( xmin , xmax ) его наблюдаемых значений на несколько ча­стичных интервалов длиной h каждый и найти для каждого из этих интервалов сумму частот nj, попавших в него.

Сту­пенчатая фигура, состоящая из прямоугольников с основания­ми длиной h и высотами nj / h (плотность частоты), называет­ся гистограммой частот. Геометрический смысл гистограммы: нетрудно видеть, что площадь ее равна сумме всех частот или объему выборки. На рис. 15.10 изображена гистограмма объе­ма п = 100.

 

 Аналогичным образом определяется и гистограмма отно­сительных частот; в этом случае высоты прямоугольников, составляющих ступенчатую фигуру, определяются отноше­ниями сумм относительных частот, попадающих в интервал  к длине интервала h , т.е. вели­чинами Wj / h . Нетрудно видеть, что площадь гистограммы относительных частот равна единице (сумме относительных частот выборки).

Одной из наиболее часто встречающихся задач, связанных с исследованием системы случайных величин, является задача выявления зависимости между этими случайными величинами. Наиболее простая — детерминированная функциональная зависимость между случайными величинами — на практике встречается редко. Как правило, между случайными величинами имеет место более сложная зависимость, когда изменение одной случайной величины обусловлено не только изменением другой, но влиянием множества других факторов, зачастую не поддающихся учету. Такая зависимость, при которой изменение одной величины приводит к изменению характеристик распределения другой величины, называется статистической.

Таким образом, статистическая зависимость между случайными величинами ХиУ может состоять из двух компонентов: функционального, обусловленного жесткой, детерминированной зависимостью между этими случайными величинами, и случайного, связанного с влиянием как раздельных для Хи 7случайных факторов, так и общих.

Взаимосвязь между случайными величинами определяется их корреляционным моментом кху или коэффициентом корреляции рху, а также уравнениями регрессии одной случайной величины на другую.

Рассмотрим методы определения названных характеристик системы случайных величин Л"и 7по их выборочным совокупностям.


Дата добавления: 2021-04-05; просмотров: 87; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!