ОСНОВЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ СОВОКУПНОСТИ СЛУЧАЙНЫХ ВЕЛИЧИН



Понятие о случайной величине

Результат отдельно наблюдения при многократном прямом измерении какой-либо физической величины из-за наличия случайных погрешностей представляет собой случайную величину.

Поскольку закономерностей в появлении этих значений нет, анализ таких величин может производиться только методами теории вероятностей и математической статистики. Для характеристики случайной величины необходимо знать совокупность возможных значений этой величины, а также вероятности, с которыми эти значения могут появляться.

 

Распределение вероятностей значений дискретной случайной величины

Для дискретной случайной величины наиболее полной статистической характеристикой является ее распределение вероятностей: указываются возможные значения этой величины xi и соответствующие им вероятности pi. Расположив значения x1, x2, …, xn в порядке возрастания и обозначив вероятности p1, p2, …, pn, получим график распределения вероятностей этой дискретной величины (рис. 4.1). Сумма всех вероятностей равна 1. Наиболее вероятной значение дискретной случайной величины называется модой (x на рис. 4.1).

 

Рис. 4.1

Закон распределения непрерывной случайной величины

Значения непрерывной случайной величины могут отличаться друг от друга сколь угодно мало, поэтому вероятность каждого из этих значений также бесконечно мала, и построить кривую распределения вероятностей невозможно.

Чтобы выявить распределение вероятностей в этом случае, рассматривается некоторое множество интервалов Δxi в диапазоне возможных значений данной случайной величины и подсчитывают частоты ni попадания значений в каждый из этих интервалов. Расположив, как и в предыдущем случае, значения xi в порядке возрастания и обозначив соответственно вероятности pi, получим ступенчатую кривую – гистограмму (рис. 4.2а). Соединив середины верхних отрезков гистограммы ломаной кривой, получим полигон частот(рис. 4.2б). Если взять бесконечно малые интервалы (Δxi 0), график потеряет ступенчатый характер и преобразуется в плавную кривую, называемую кривой распределения плотности вероятности  f(x) для данной непрерывной случайной величины (рис. 4.2в).

 

 

Рис. 4.2

 

Уравнение, описывающее эту кривую, называется законом распределения данной непрерывной случайной величины. Площадь под всей кривой f(x) равна вероятности появления любого из возможных значений xi, т.е. равна 1:

Модойдля непрерывной случайной величины называется максимальное значение распределения.

Важным моментом является то, что существует оптимальное число интервалов группирования m, когда ступенчатая огибающая гистограммы наиболее близка к плавной кривой распределения генеральной совокупности. При слишком малом числе интервалов гистограмма будет отличаться от плавной кривой распределения вследствие слишком крупной ступенчатости (рис. 4.3а), из-за чего характерные особенности будут просто потеряны. Естественно считать, что появляющиеся при группировании провалы и выбросы являются случайным «шумом». Укрупнение интервалов группирования является методом фильтрации этого случайного «шума» (рис. 4.3б). Однако при слишком протяженных интервалах начнет «фильтроваться» уже не «шум», а сам «сигнал», т.е. начинают сглаживаться особенности искомого закона распределения.

 

 

Рис. 4.3

 

 

Оптимальное число интервалов (рис. 4.3в) можно рассчитать по формулам Старджеса

 

m = 3,3lg n + 1

Брукса и Каррузера

m = 5lg n

или Хайнольда и Гаеде

m = .

В области значений n<100 результаты расчетов по вышеприведенным формулам близки между собой.

 


Дата добавления: 2018-02-28; просмотров: 283;