Приложение 4.1. Основные положения теории вероятностей и математической статистики



Лекция 4. Статистическая обработка результатов измерений

 

4.1. Основные положения

На результаты измерений оказывают влияние большое число различных факторов, многие из которых носят случайный характер. Вследствие этого в общем случае результаты измерений являются случайными величинами и для их обработки требуется применение аппарата математической статистики и теории вероятностей. Некоторые основные положения теории вероятностей и математической статистики, необходимые для освоения данного материала, содержатся в Приложении 4.1.

Важность такого рассмотрения можно видеть из следующего примера. Предположим, что мы оцениваем надежность железобетонной балки. Под воздействием нагрузок внутри балки возникают напряжения σд.Если повсюду действующие напряжения σд меньше предела прочности материала σr ,

 σд < σr,                                                                             (4.1.)

то балка не разрушится. При нарушении  условия (4.1.), произойдет разрушение. Оценим вероятность такого события.

В табл. 4.1. представлены результаты измерения пределов прочности образцов бетона. В столбце 2 отражены диапазоны полученных значений пределов прочности σr. В столбце 3 указано число результатов испытаний mi, попавших в данный диапазон. В столбце 4 приведена относительная частота испытаний, попавших в данный диапазон pi=mi/N. Здесь N – общее число испытаний, которое в данном случае равно 55.

 


Таблица 4.1.   Результаты измерений пределов прочности материала

i

σr

mi

pi

1

2

3

4

1

170-180

2

0,036

2

180-190

7

0,127

3

190-200

15

0,273

4

200-210

18

0,327

5

210-220

8

0,145

6

220-230

4

0,073

7

230-240

1

0,018

Множество результатов испытаний образуют статистическую выборку.

Величина pi называется эмпирической плотности распределения случайной величины для данной статистической выборки. На рис. 4.1. представлена диаграмма, отражающая зависимость эмпирической плотности распределения от случайной величины σr.  Такая диаграмма называется гистограммой.

 


Рис. 4.1. Эмпирическая плотность распределения предела прочности

Из рассмотрения гистограммы мы можем предположить, что наиболее вероятные значения пределов прочности находятся в диапазоне 205-210 МПа. При этом существует нулевая вероятность  выхода значений пределов прочности из диапазона 180-240 МПа.

Предположим, что действующие напряжения σднаходится в диапазоне

180-240 МПа

На рис. 4.2. показаны функции распределение действующих напряжений и предела прочности. В диапазоне значений 170 - 180 МПа  кривые пересекаются. Заштрихованная область соответствует событиям, когда действующие напряжения превышают предел прочности. Площадь заштрихованной  области соответствует вероятности таких событий, то есть вероятности разрушения.  Отсюда видно, что при решении технических задач, связанных с использованием результатов измерений важно знать оценки истинных значений измеряемых величин, степень их статического разброса, границы доверительных интервалов. Такие характеристики можно получить путем статистического анализа результатов многократных измерений

 

Рис. 4.2. Распределение действующих напряжений и предела прочности

Основными задачами обработки результатов измерений являются:

1. Оценка истинного значения измеряемой величины.

2. Оценка погрешности измерения.

3. Определение законов распределения случайных величин – результатов измерений.

4. Оценка доверительных интервалов и доверительной вероятности для результатов измерений

 

При многократных измерениях одного и того же параметра в качестве оценки истинного значения используют среднее арифметическое значение:

ЗдесьXi — результат i-го измерения; п — число измерений в ряду.

Для оценки рассеяния единичных результатов измерений xi в ряду равноточных измерений одной и той же физической величины около среднего их значения используют среднеквадратичную погрешность измерений (эмпирическую) (СКП):

, при n < 20

или

,при n ³ 20

 

 

Результаты измерений находятся с доверительной вероятностью Р в интервале

 

,

где zp квантиль нормального распределения, соответствующая вероятности P.

 

Величина ,  полученная в одной серии измерений, является случайным приближением к Хr. Для оценки ее возможных отклонений от Хr (случайной погрешности среднего арифметического значения результата измерений одной и той же величины в одном ряду измерений) определяют среднюю квадратичную погрешность (СКП)

,

которая получена из ряда равноточных измерении. Величина  - дисперсия измерения.

Отсюда

,

т.е. СКП из серии измерений всегда меньше, чем в каждом отдельном измерении, отсюда следует, что для повышения точности измерений необходимо увеличивать число измерений.

Можно показать, что средний результат при малом числе измерений nнаходится с доверительной вероятностью Р в интервале

Здесь  tp,n-1– коэффициент Стьюдента, зависящий от степени свободы n и доверительной вероятности Р.

 

Иными словами,  вероятность того, что истинная величина лежит в указанных границах,  равна:

 

 


Здесь  Sn(t) – интегральная функция распределения Стьюдента.


Таблица 4.2.

Распределение Стьюдента

Вероятность Р{t >= t(k; a )} = a , где k – число степеней свободы

k

a, односторонняя область

k

a, односторонняя область

  0,10 0,05 0,01   0,10 0,05 0,01
 

a, двусторонняя область

 

a, двусторонняя область

  0,20 0,10 0,02   0,20 0,10 0,02
1 3,078 6,314 31,821 17 1,333 1,740 2,567
2 1,886 2,920 6,965 18 1,330 1,734 2,552
3 1,638 2,353 4,541 19 1,328 1,729 2,539
4 1,533 2,132 3,747 20 1,325 1,725 2,528
5 1,476 2,015 3,365 21 1,323 1,721 2,518
6 1,440 1,943 3,143 22 1,321 1,717 2,508
7 1,415 1,895 2,998 23 1,319 1,714 2,500
8 1,397 1,860 2,896 24 1,318 1,711 2,492
9 1,383 1,833 2,821 25 1,316 1,708 2,485
10 1,372 1,812 2,764 26 1,315 1,706 2,479
11 1,363 1,796 2,718 27 1,314 1,703 2,473
12 1,356 1,782 2,681 28 1,313 1,701 2,467
13 1,350 1,771 2,650 29 1,311 1,699 2,462
14 1,345 1,761 2,624 30 1,310 1,697 2,457
15 1,341 1,753 2,602 40 1,303 1,684 2,423
16 1,337 1,746 2,583 60 1,296 1,671 2,390

 

4.2. Основные операции при обработке данных

Отбраковка грубых промахов.

Оценка закона и параметров распределения.

Оценка доверительных интервалов и доверительных вероятностей.

Приложение 4.1. Основные положения теории вероятностей и математической статистики

4.1.1. Случайные величины. Действительное переменное, которое в зависимости от исхода опыта, т. е. в зависимости от случая принимает различные значения, называется случайной величиной.

Пусть X некоторая случайная величина. Функцией распределенияF (х) случайной величины X называется функция:

F(x) = P(X < x)).                     (П4.1)

Значение функции распределения в точке х0, таким образом, равно вероятности того, что случайная величина принимает значение, меньшее х0. В теории вероятностей случайная величина полностью характеризуется своей функцией распределения, т. е. может рассматриваться как заданная, если задана ее функция распределения. При помощи функции распределения можно указать вероятность, что случайная величина попадает в заданный полуоткрытый промежуток:

Р(а≤ Х <b) = F(b)-F(a).                           (П4.2)

Функция распределения F (х) произвольной случайной величины обладает следующими свойствами:

1.

2). F(x) монотонно не убывает, т.е. при х1 < х2 имеет место неравенство F(x1)<F(x2).

П4.2. Дискретные случайные величины.Случайная величина X называется дискретной, если она может принимать только конечное, или счетное, -  множество значений. Таким образом, она характеризуется значениями х1, х2, .xi..xn, которые она может принимать, и вероятностями pi= Р(X =xi), c которыми она принимает эти значения и которые должны удовлетворять условию

……….(П4.3.)

Однозначное отображение множества х, на множество pt рассматривается как функция вероятности случайной величины. Для функции распределения дискретной случайной величины имеем

F(x)=                                               (П4.4.)

Суммирование производится по всем i, для которых х i < х. Таким образом, F (х) является ступенчатой функцией со скачками высотой pt в точках xt (рис. П4.1)

Рис. П4.1. Функция распределения дискретной случайной величины

 

П4.3. Непрерывные случайные величины.Случайная величина называется непрерывной, если ее функцию распределения (интегральную функцию распределения} можно представить в виде

                                                          (П4.5)

Функция f (х) называется плотностью распределения. Так  как

то должно выполняться  условие      

                                                                (5.6)

При заданной плотности вероятности, вероятность того, что случайная величина попадает в заданный промежуток, равна (рис. П4.1)

 

 


Вероятность P(X=a), т.е. вероятность, что непрерывная случайная величина равна заданному действительному числу, всегда равна 0. Отметим, что из равенства Р (А) = 0 не следует, что Аявляется невозможным событием, хотя P(A) = 0.

 

Равномерное распределение. Случайная величина называется равномерно распределеннойна [а, b], если ее плотность вероятности на [а, b] постоянна, а вне [а, b]равна 0

 

Так как

,

то

 

Нормальное распределение (Распределение Гаусса).  Этот вид распределения является наиболее важным в связи с центральной предельной теоремой теории вероятностей: распределение суммы независимых случайных величин стремится к нормальному с увеличением их количества при произвольном законе распределения отдельных слагаемых, если слагаемые обладают конечной дисперсией. Кроме того, А.М. Ляпунов доказал, что распределение параметра стремится к нормальному, если на параметр оказывает влияние большое количество факторов и ни один из них не является превалирующим. Функция плотности нормального распределения унимодальная, симметричная, аргумент х может принимать любые действительные значения:

Плотность распределения

Здесь a – математическое ожидание;

σ – среднеквадратическое отклонение;

σ2 - дисперсия.

 

Рис. П4.2. Вид плотности и функции нормального распределения при

sx=1.

 

Распределение t = X/Y с независимыми X и У, где X нормально распределено с законом N(x;0,1), называется t-распределением или распределением Стьюдента с n степенями свободы. Распределение Стьюдента (t-распределение, предложено в 1908 г. английским статистиком В. Госсетом, публиковавшим научные труды под псевдонимом Student) характеризует распределение случайной величины

 

где u0, u1, …, uk взаимно независимые нормально распределенные случайные величины с нулевым средним и конечной дисперсией. Аргумент t не зависит от дисперсии слагаемых. Функция плотности распределения Стьюдента имеет вид :

 

 


Величина k характеризует количество степеней свободы. Плотность распределения – унимодальная и симметричная функция, похожая на нормальное распределение, рис. 3.7

 

 

Рис. П4.3.  Плотность распределения Стьюдента

Распределение Стьюдента применяется для описания ошибок выборки при k<30. При k, превышающем 100, данное распределение практически соответствует нормальному, для значений k из диапазона от 30 до 100 различия между распределением Стьюдента и нормальным распределением составляют несколько процентов. Поэтому относительно оценки ошибок малыми считаются выборки объемом не более 30 единиц, большими – объемом более 100 единиц. При аппроксимации распределения Стьюдента нормальным распределением для односторонней критической области вероятность

Р{t>t(k; a)} = u1–a(0, k /(k–2)),

где u1–a(0, k/(k–2)) – квантиль нормального распределения. Аналогичное соотношение можно составить и для двусторонней критической области.

 

При проверке гипотез широкое применение находит ряд теоретических законов распределения. Наиболее важным из них является нормальное распределение. С ним связаны распределения хи-квадрат, Стьюдента, Фишера, а также интеграл вероятностей. Для указанных законов функции распределения аналитически не представимы. Значения функций определяются по таблицам или с использованием стандартных процедур пакетов прикладных программ. Указанные таблицы обычно построены в целях удобства проверки статистических гипотез в ущерб теории распределений – они содержат не значения функций распределения, а критические значения аргумента z(a).

Для односторонней критической области z(a)=z1–a, т.е. критическое значение аргумента z(a) соответствует квантили z1–a уровня 1–a, рис 3.3, так как

.


Дата добавления: 2018-04-15; просмотров: 403; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!