Критерий согласия хи-квадрат
Постановка задачи.
Требуется проверить гипотезу о том, что функция распределения выборочных данных принадлежит нормальному семейству распределений (экспоненциальному, равномерному семейству).
Теоретические основы.
См. стр. 33-36 пособия [4].
Вычисления.
Пакет Excel предоставляет возможность вычисления как значений функции надежности , так и значений p-квантилей хи-квадрат распределения. Эти функции называются ХИ2РАСП и ХИ2ОБР.
Для вычисления нормального распределения можно использовать функцию НОРМРАСП. Подробнее см. ниже в главе “Встроенные функции Excel”.
Интервалы группировки и частоты попадания в эти интервалы могут быть взяты из задания 2.
Ниже приведен фрагмент листа Excel с примером вычислений, проводимых при построении критерия хи-квадрат для проверки гипотезы нормальности.
Пример.
A | B | C | D | E | F | G | H | |||
1 | Границы | Выбор. частоты | Вероятность | Ожидаем. частоты | Хи- квадрат |
| ||||
2 | 0 | |||||||||
3 | 117,05 | 0 | 0,001 | 0,15 | 0,151 | Критический уровень | ||||
4 | 118,05 | 1 | 0,013 | 1,19 | 0,031 | значимости | ||||
5 | 119,05 | 3 | 0,071 | 5,86 | 1,395 | 9 ст.свободы | ||||
6 | 120,05 | 20 | 0,237 | 16,76 | 0,624 | a9 = | 0,101 | |||
7 | 121,05 | 34 | 0,514 | 27,98 | 1,293 | 7 ст.свободы | ||||
8 | 122,05 | 23 | 0,784 | 27,27 | 0,669 | a7 = | 0,041 | |||
9 | 123,05 | 13 | 0,938 | 15,51 | 0,407 |
| ||||
10 | 124,05 | 3 | 0,989 | 5,15 | 0,896 | 0,05 | ||||
11 | 125,05 | 4 | 0,999 | 0,99 | 9,076 |
| ||||
12 | >125,05 | 0 | 1 | 0,12 | 0,119 | |||||
13 | Всего | 101 | 101,00 | Вывод | ||||||
14 | Гипотеза нормальности не может быть принята или отвергнута | |||||||||
15 | X2= | 14,66 |
a Порядок вычислений.
1) Скопировать ячейки A2:B11 с листа “Гисто”, содержащие выборочные частоты, на рабочий лист в ячейки A3:B12.
2) В ячейке подсчитать B13 общее число данных
Ø =СУММ(A3:B12)
В столбце C (Вероятность) вычислить значение гипотетической функции распределения :
3) в ячейку C3 (напротив первой границы) ввести формулу
Ø =НОРМРАСП(A3;Моменты!$B$4;Моменты!$B$6;1)
– напомним, что в ячейках B4 и B6 на листе “Моменты” хранятся среднее и стандартное отклонение;
4) скопировать ячейку C3 во все ячейки столбца C вплоть до ячейки, соответствующей последней границе (C11);
5) в ячейке C2 указать значение 0 (соответствует ), а в ячейке C12 – значение 1 (соответствует ).
В столбце D (Ожидаемые частоты) вычислить теоретические частоты :
6) в ячейку D3 ввести формулу
Ø = $B$13*(C3-C2)
7) скопировать ячейку D3 в столбце D до ячейки D12 (напротив границы “>125,05”);
8) для контроля в ячейке D13 (Всего) вычисляется сумма значений в столбце D (должно получиться число 1).
|
|
В столбце E (Хи-квадрат) вычислить слагаемые статистики :
9) в ячейку E3 ввести формулу
Ø = (B3-D3)^2/($B$13*D3)
– в ячейке $B$13 хранится объем выборки;
10) скопировать ячейку E3 в столбце E до ячейки E12;
11) в ячейке E15 вычислить сумму значений столбца E – искомое значение статистики .
Вычислить уровни значимости ar-3 , ar-1 :
12) в ячейки G6, G8 ввести формулы
Ø =ХИ2РАСП(E15;10-1)
Ø =ХИ2РАСП(E15;10-3)
“10” – это число групп, для каждого студента оно может быть разным.
Вывод в ячейке F11 сделан в соответствии с правилом, описанным в пункте VII на стр. 36 пособия [4].
Замечание 1. При проверке гипотезы экспоненциальности необходимо заменить ячейки, в которых вычисляются значения вероятностей попадания в интервалы (пункт 2) в соответствии с формулой экспоненциального распределения
Ø =1-EXP(-A3/Моменты!$B$4)
Критический уровень значимости вычисляется при и при степенях свободы.
Замечание 2. При проверке гипотезы равномерности необходимо, во-первых, выбрать равномерное разбиение отрезка [0;1]. Во-вторых, нужно заменить ячейки, в которых вычисляются значения вероятностей попадания в интервалы (пункт 2) в соответствии с формулой равномерного распределения (см. введение)
|
|
Ø =A3
Критический уровень значимости вычисляется при степени свободы.
Контрольные вопросы.
1. Сформулируйте статистическую задачу.
2. Как строится критерий согласия хи-квадрат?
Ответ: см. [4] стр. 33.
3. Почему критерий называется критерием согласия?
Ответ: см. [4] стр. 36.
4. Выпишите формулу тестовой статистики критерия согласия хи-квадрат. Почему эту статистику можно считать мерой близости выборочных данных к выдвинутой гипотезе?
Ответ: см. [4] стр. 33.
5. Какое распределение имеет статистика критерия хи-квадрат?
Ответ: см. [4] стр. 35.
6. Почему иногда приходится вычислять два критических уровня значимости?
Ответ: см. [4] стр. 36.
7. Чему равен критический уровень значимости при проверке гипотезы о равномерном (нормальном, экспоненциальном) распределении?
Ответ: см. [4] стр. 36.
8. Почему при построении критерия хи-квадрат нельзя выбирать интервалы группировки в зависимости от выборочных данных?
Ответ: см. [4] стр. 36.
Задание 5.
Дата добавления: 2018-04-05; просмотров: 402; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!