Критерий согласия хи-квадрат



 

Постановка задачи.

Требуется проверить гипотезу  о том, что функция распределения выборочных данных  принадлежит нормальному семейству распределений  (экспоненциальному, равномерному семейству).

 

Теоретические основы.

См. стр. 33-36 пособия [4].

 

Вычисления.

Пакет Excel предоставляет возможность вычисления как значений функции надежности , так и значений p-квантилей хи-квадрат распределения. Эти функции называются ХИ2РАСП и ХИ2ОБР.

 

Для вычисления нормального распределения можно использовать функцию НОРМРАСП. Подробнее см. ниже в главе “Встроенные функции Excel”.

 

Интервалы группировки и частоты попадания в эти интервалы могут быть взяты из задания 2.

 

Ниже приведен фрагмент листа Excel с примером вычислений, проводимых при построении критерия хи-квадрат для проверки гипотезы нормальности.

 


Пример.

 

  A B C D E F G H
1 Границы Выбор. частоты Вероятность Ожидаем. частоты Хи- квадрат

 

2     0    
3 117,05 0 0,001 0,15 0,151

Критический уровень

4 118,05 1 0,013 1,19 0,031

значимости

5 119,05 3 0,071 5,86 1,395

9 ст.свободы

6 120,05 20 0,237 16,76 0,624 a9 = 0,101
7 121,05 34 0,514 27,98 1,293

7 ст.свободы

8 122,05 23 0,784 27,27 0,669 a7 = 0,041
9 123,05 13 0,938 15,51 0,407

 

10 124,05 3 0,989 5,15 0,896

0,05

11 125,05 4 0,999 0,99 9,076

 

12 >125,05 0 1 0,12 0,119
13 Всего 101   101,00  

Вывод

14          

Гипотеза нормальности не может быть принята или отвергнута

15       X2= 14,66

 

a  Порядок вычислений.

1) Скопировать ячейки A2:B11 с листа “Гисто”, содержащие выборочные частоты, на рабочий лист в ячейки A3:B12.

2) В ячейке подсчитать  B13 общее число данных

Ø =СУММ(A3:B12)

 

В столбце C (Вероятность) вычислить значение гипотетической функции распределения :

 

3) в ячейку C3 (напротив первой границы) ввести формулу

Ø =НОРМРАСП(A3;Моменты!$B$4;Моменты!$B$6;1)

– напомним, что в ячейках B4 и B6 на листе “Моменты” хранятся среднее и стандартное отклонение;

4) скопировать ячейку C3 во все ячейки столбца C вплоть до ячейки, соответствующей последней границе (C11);

5) в ячейке C2 указать значение 0 (соответствует ), а в ячейке C12 – значение 1 (соответствует ).

 

В столбце D (Ожидаемые частоты) вычислить теоретические частоты :

 

6) в ячейку D3 ввести формулу

Ø = $B$13*(C3-C2)

7) скопировать ячейку D3 в столбце D до ячейки D12 (напротив границы  “>125,05”);

8) для контроля в ячейке D13 (Всего) вычисляется сумма значений в столбце D (должно получиться число 1).

 

В столбце E (Хи-квадрат)  вычислить слагаемые статистики :

 

9) в ячейку E3 ввести формулу

Ø = (B3-D3)^2/($B$13*D3)

– в ячейке $B$13 хранится объем выборки;

10) скопировать ячейку E3 в столбце E до ячейки E12;

11) в ячейке E15 вычислить сумму значений столбца E – искомое значение статистики .

 

Вычислить уровни значимости ar-3 , ar-1 :

 

12) в ячейки G6, G8 ввести формулы

Ø =ХИ2РАСП(E15;10-1)

Ø =ХИ2РАСП(E15;10-3)

10” – это число групп, для каждого студента оно может быть разным.

 

Вывод в ячейке F11 сделан в соответствии с правилом, описанным в пункте  VII на стр. 36 пособия [4].

 

Замечание 1. При проверке гипотезы экспоненциальности необходимо заменить ячейки, в которых вычисляются значения вероятностей попадания в интервалы (пункт 2) в соответствии с формулой экспоненциального распределения

Ø =1-EXP(-A3/Моменты!$B$4)

Критический уровень значимости вычисляется при  и при  степенях свободы.

Замечание 2. При проверке гипотезы равномерности необходимо, во-первых, выбрать равномерное разбиение отрезка [0;1]. Во-вторых, нужно заменить ячейки, в которых вычисляются значения вероятностей попадания в интервалы (пункт 2) в соответствии с формулой равномерного распределения (см. введение)

Ø =A3 

Критический уровень значимости вычисляется при  степени свободы.

 


Контрольные вопросы.

1. Сформулируйте статистическую задачу.

2. Как строится критерий согласия хи-квадрат?

Ответ: см. [4] стр. 33.

3. Почему критерий называется критерием согласия?

Ответ: см. [4] стр. 36.

4. Выпишите формулу тестовой статистики критерия согласия хи-квадрат. Почему эту статистику можно считать мерой близости выборочных данных к выдвинутой гипотезе?

Ответ: см. [4] стр. 33.

5. Какое распределение имеет статистика критерия хи-квадрат?

Ответ: см. [4] стр. 35.

6. Почему иногда приходится вычислять два критических уровня значимости?

Ответ: см. [4] стр. 36.

7. Чему равен критический уровень значимости при проверке гипотезы о равномерном (нормальном, экспоненциальном) распределении?

Ответ: см. [4] стр. 36.

8. Почему при построении критерия хи-квадрат нельзя выбирать интервалы группировки в зависимости от выборочных данных?

Ответ: см. [4] стр. 36.

 


Задание 5.


Дата добавления: 2018-04-05; просмотров: 402; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!