Проверка гипотез о законе распределения



Проверка статистических гипотез.

 

Статистическая гипотеза -- это предположение о генеральной совокупности, высказанное на основании статистических выборочных данных.

Статистическая проверка гипотез -- это процедура обоснованного сопоставления высказанной гипотезы с имеющимися выборочными данными.

Например: исследуем влияние нового лекарственного препарата на снижение артериального давления.

X{x1, x2, … xn1}     -- контрольная группа (выборка, объёмом n1)

Y{y1, y2, … yn2}     -- опытная группа (выборка объёмом n2)

Высказываются две альтернативные гипотезы:

Н0: -- различия между выборками не достоверны (т.е. носят случайный характер).

Н: -- различия между выборками достоверны (т.е. влияние препарата достоверно (эффективно))

Чтобы принять или опровергнуть эти предположения, используют статистические критерии или критерии достоверности.

Статистический критерий  -- это случайная величина, закон распределения которой известен, т.е. каждому значению критерия поставлена в соответствие вероятность, с которой он эти значения принимает.

Для каждого критерия существует таблица, в которой содержатся критические значения критерия. Каждое критическое значение соответствует определённому уровню значимости α  и числу степеней свободы (или к)

  где а -- число наложенных связей или ограничений.

α=1-РД --  это вероятность принять ошибочную гипотезу.

Критические значения позволяют определить вероятность нулевой гипотезы: Р(Н0).

Гипотеза Н0 принимается, если в результате проверки выяснилось, что её вероятность больше выбранного уровня значимости.

                   если Р(Н0)>α , то Н0 принимаем,

                   если Р(Н0)<α , то Н0 отвергаем.

Например: Хотим доказать достоверность различия между выборками        X{x1, x2, … xn1}иY{y1, y2, … yn2} с РД=0,95 (это значит, что влияние препарата достоверно (эффективно) на 95%).

Если в результате проверки выяснилось, что Р(Н0)˃α , (т.е. ˃0,05), то мы вынуждены принять гипотезу Н0, так как Р(Н)<РД

Р(Н)<0,95.

 

Основные этапы проверки статистических гипотез.

1).Выдвигается гипотеза Н0.

2).Выбирается величина уровня значимости α (α=1-РД).

3).По заданному α и числу степеней свободы ν(или к) в таблице находим критическое (табличное) значение критерия.

4).Подсчитывается экспериментальное значение критерия по имеющимся выборкам (для каждого критерия существует формула для определения значения критерия).

5).С помощью сравнения экспериментального и критического значений делается вывод о правомерности гипотезы Н0.

6).Если Н0  принимается, следовательно гипотеза Н (о достоверности различий) не верна.

Если Н0 отвергается, следовательно верна гипотеза Н..(Н0 и Н -- противоположные события).

Критерии достоверности подразделяются на параметрические и непараметрические.

Параметрическиекритерии для вычисления экспериментального значения используют статистические параметры: . Они могут использоваться для выборочных совокупностей, распределённых по закону близкому к нормальному (Гаусса).

Непараметрические критерии не требуют вычисления выборочных параметров, они менее точны, дают более грубую оценку, чем параметрические критерии, но:

1). Их можно применять к выборкам, закон распределения которых неизвестен (не обязательно нормальное распределение).

 2). Они проще и позволяют быстрее производить проверку рассматриваемых гипотез.

Проверка гипотез о законе распределения.

Проверку гипотезы о законе распределения (то есть, соответствует ли выборочная совокупность какому либо определённому распределению) проводят с помощью критерия соответствия (предложен К.Пирсоном в 1900г.).

 

Критерий Пирсона ( ).

Н0заключается в том, что различие между наблюдаемыми экспериментальными частотами mi попадания вариант выборки в интервалы вариационного ряда от вычисленных теоретических частот mi теор=mi·Pi теор не достоверно (т.е. носит случайный характер). Другими словами:

Н0: экспериментальные данные соответствуют предложенному теоретическому закону распределения.

Экспериментальное значение критерия вычисляется по формуле:

где  -- объём выборки, к -- количество интервалов,

-- вероятность попадания в интервал для теоретического распределения.

 

Затем, по таблице критерия Пирсона для заданного уровня значимости α и числа степеней свободы ,   где а -- число наложенных связей, находим .

если теоретическое распределение произвольное, то а=1,

если теоретическое распределение распределено по нормальному закону Гаусса, то а=3 -- числу параметров, необходимых для вычисления вероятности: М[X],D[X] и σ[X],.                                         следовательно

Если Н0 принимаем.

Вывод: экспериментальное распределение соответствует теоретическому.

 

Если Н0 отвергаем.

Вывод: экспериментальное распределение не соответствует теоретическому.

 

 

Пример: Изучался рост 50 человек. В таблице приведены экспериментальные частоты попадания в интервал mi и теоретические частоты, рассчитанные из вероятностей попадания в интервал для распределения Гаусса. К=5 , n=50.ν=5-3=2,

№ интервала 1 2 3 4 5
 mi практические 5 9 22 8 6
 mi теоретические 5 10 20 10 5
0,1 0,2 0,4 0,2 0,1


Н0: Экспериментальное (практическое) распределение соответствует распределению Гаусса. (То есть различие между частотами не достоверно, носит случайный характер).

Из таблицы для  ν=5-3=2  и  ά=0,05 находим =5,99

Т.к.    Н0 принимаем.

Вывод:  практическое распределение соответствует распределению Гаусса.

 

 

Критерий Стьюдента.

Параметрический критерий , который используют для проверки статистических гипотез по выборкам, распределённым по нормальному закону Гаусса.

Используется:

1). Для определения достоверности среднего арифметического, полученного для одной выборки.

2). Для определения достоверности различия средних арифметических двух выборок.

3). Для определения достоверности корреляции двух случайных величин.


Дата добавления: 2018-04-05; просмотров: 458; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!