Кусочная аппроксимация эмпирических распределений



 

Точки на поле вероятностного графика нередко располагаются так, что аппроксимировать их можно не менее чем двумя или тремя прямыми (см. рис. 29). В этом случае может быть выбрана гипотеза о смеси двух статистических ансамблей, представленных в выборке в некотором соотношении Z. Более сложные смеси лучше не рассматривать, поскольку для них нужны чрезмерно большие выборки.

 

 

 


Рис. 29. Кусочная аппроксимация (смесь двух статистических ансамблей).

 

Теоретические функции, аппроксимирующие участки эмпирической функции, строятся точно также, как единственная Fт(х). Однако каждый участок содержит относительно небольшое число точек, представляющих прямую, независимо от других. Чем меньше точек, тем необоснованнее прямая, проведенная в их окрестности. Все прямые на поле вероятностного графика пересекают экстремальные значения вертикальной шкалы. Точки пересечения прямых между собой определяют соотношение Z в смеси, которую представляет выборка.

Достоверность оценки Z определяется шириной доверительных интервалов для каждой из пересекающихся прямых, а также углом между ними. Чем больше этот угол, тем достовернее решение задачи разделения «мух и щей». Если при повторении эксперимента остается необходимость аппроксимации несколькими прямыми, то гипотеза о смеси будет безальтернативной.

Обычно «эффект смеси» получается при добавлении в статистический ансамбль объектов с необычными данными. Например, среди местных покупателей появились приезжие, более «щедрые». Аналогичен итог вычитания из ансамбля части объектов, к примеру, среди покупателей редки пенсионеры вечером.

Иногда требуется восстановить статистические меры смешанных в выборке статистических ансамблей. В литературе часто упоминаются «бимодальные» распределения. Несколько модальных значений является следствием смеси. Однако искать моды по гистограммам, как это часто делают, рискованно из-за методических погрешностей. Вероятностные графики не вносят методические погрешности, однако сама постановка задачи вносит многозначность решения. Выборку делят не две части – с наиболее вероятностной принадлежностью к одной части смеси и с неизвестной принадлежностью. В зоне пересечения прямых точки могут быть из обеих частей смеси с равной вероятностью. Задача решается путем последовательного перебора адресации сомнительных точек в обе части и построения искомых функций.

 

5.8. Анализ отклонений эмпирических данных от Fт(х)

 

Отклонение эмпирических данных от теоретических анализируются в задачах оценок погрешностей измерений, представительности выборок, достоверности квантилей и т.п. Предполагается в этих задачах, что теоретическая функция Fт(х) адекватно представляет статистический ансамбль. Эмпирические значения отклоняются соответственно гипотезе, которую требуется проверить. К примеру, на данные о погоде за год накладываются погрешности градусника. Есть теоретическая функция распределения температур Fт(Т) и эмпирическая Fэ(Т), по которой надо проверить гипотезу.

 


Рис. 30. Анализ погрешности измерений градусника.

Здесь Fт(e) – функция распределения погрешностей градусника. Fт(Т) и Fэ(Т) – функция распределения температур теоретическая и эмпирическая.

 

Предполагается по гипотезе, что показания градусника имеют рассеяние, соответствующее НР. Поэтому измеряются на поле вероятностного графика расстояние по горизонтали между эмпирическими точками и реализациями Fэi) – Fтi) = DТi (см. рис. 30). Для DТi строится горизонтальный масштаб, достаточно «растянутый». Под ним размещаются точки, а по ним строится новая функция распределения отклонений Fэ(DТi). Если гипотеза верна, то новая функция будет хорошо аппроксимироваться НР, ее среднее квадратичное отклонение будет определять погрешность термометра случайную, а отклонение среднего значения – систематичную.

 


Дата добавления: 2019-01-14; просмотров: 245; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!