АЛГОРИТМ Подсчета критерия Н Крускала-Уоллиса



Критерий КРУСКАЛА — УОЛЛИСА

Назначение критерия

Критерий предназначен для оценки различий одновременно между тремя, четырьмя и т.д. выборками по уровню какого-либо признака. Критерий Краскела-Уоллиса является ранговым, поэтому он инвариантен по отношению к любому монотонному преобразованию шкалы измерения.

Он позволяет установить, что уровень признака изменяется при переходе от группы к группе, но не указывает на направление этих изменений.

Описание критерия

Критерий Н иногда рассматривается как непараметрический аналог метода дисперсионного однофакторного анализа для несвязных выборок (Тюрин Ю. Н., 1978). Иногда его называют критерием "суммы рангов" (Носенко И.А., 1981).

Данный критерий является продолжением критерия U на большее, чем 2, количество сопоставляемых выборок. Все индивидуальные значения ранжируются так, как если бы это была одна большая выборка. Затем все индивидуальные значения возвращаются в свои первоначальные выборки, и мы подсчитываем суммы полученных ими рангов отдельно по каждой выборке. Если различия между выборками случайны, суммы рангов не будут различаться сколько-нибудь существенно, так как высокие и низкие ранги равномерно распределятся между выборками. Но если в одной из выборок будут преобладать низкие значения рангов, в другой - высокие, а в третьей - средние, то критерий Н позволит установить эти различия.

Гипотезы

H0: Между выборками 1, 2, 3 и т. д. существуют лишь случайные различия по уровню исследуемого признака.

H1: Между выборками 1, 2, 3 и т. д. существуют неслучайные различия по уровню исследуемого признака.

Возможные варианты соотношения рядов значений в трёх выборках

Критерий Н оценивает общую сумму перекрещивающихся зон при сопоставлении всех обследованных выборок. Если суммарная область наложения мала (вариант а), то различия достоверны; если она достигает определенной критической величины и превосходит ее (вариант б), то различия между выборками оказываются недостоверными.

Ограничения критерия Н

1. При сопоставлении 3-х выборок допускается, чтобы в одной из них n=3, а двух других п=2. Но при таких численных составах выборок мы сможем установить различия лишь на низшем уровне значимости (Р≤0,05).

Для того, чтобы оказалось возможным диагностировать различия на более высоком уровнем значимости (р≤0,01), необходимо, чтобы в каждой выборке было не менее 3 наблюдений, или чтобы по крайней мере в одной из них было 4 наблюдения, а в двух других - по 2; при этом неважно, в какой именно выборке сколько испытуемых, а важно соотношение 4:2:2.

1.2. Критические значения критерия Н и соответствующие им уровни значимости приведены в Таблицей критических значений критерия Н Краскела-Уоллиса для различных сочетаний n1, n2, n3.

Таблица предусмотрена только для трех выборок и {n1, n2, n3} ≤ 5.

При бOльшем количестве выборок и испытуемых в каждой выборке необходимо пользоваться Таблицей критических значений критерия χ2, поскольку критерий Крускала-Уоллиса асимптотически приближается к распределению χ2, (Носенко И.А., 1981; J. Greene, M. DOlivera, 1982).

Количество степеней свободы при этом определяется по формуле:

v = c - l , где с - количество сопоставляемых выборок.

1.3. При множественном сопоставлении выборок достоверные различия между какой-либо конкретной парой (или парами) их могут оказаться стертыми. Это ограничение можно преодолеть, если провести все возможные попарные сопоставления, число которых будет равняться ½ [c* (c-1)]*1. Для таких попарных сопоставлений используется, естественно, критерий для двух выборок, например U или φ*.

 

Пример 1

В эксперименте по исследованию интеллектуальной настойчивости (Е.В. Сидоренко, 1984) 22 испытуемым предъявлялись сначала разрешимые четырехбуквенные, пятибуквенные и шестибуквенные анаграммы, а затем неразрешимые анаграммы, время работы над которыми не ограничивалось. Эксперимент проводился индивидуально с каждым испытуемым. Использовалось 4 комплекта анаграмм. У исследователя возникло впечатление, что над некоторыми неразрешимыми анаграммами испытуемые продолжали работать дольше, чем над другими, и, возможно, необходимо будет делать поправку на то, какая именно неразрешимая анаграмма предъявлялась тому или иному испытуемому. Показатели длительности попыток в решении неразрешимых анаграмм представлены в Табл. 2.5. Все испытуемые были юношами-студентами технического вуза в возрасте от 20 до 22 лет.

Можно ли утверждать, что длительность попыток решения каждой из 4 неразрешимых анаграмм примерно одинакова?

Таблица 2.5

Показатели длительности попыток решения 4 неразрешимых анаграмм в секундах (N=22)

  Группа 1: анаграмма ФОЛИТОН (n1=4) Группа 2: анаграмма КАМУСТО (n2=8) Группа 3: анаграмма СНЕРАКО (n3=6) Группа 4: анаграмма ГРУТОСИЛ (n4=4)
1 145 145 128 60
2 194 210 283 2361
3 731 236 469 2416
4 1200 385 482 3600
5   720 1678  
б   848 2081  
7   905    
8   1080    
Суммы 2270 4549 5121 8437
Сред-ние 568 566 854 2109

 

Сформулируем гипотезы.

Н0: 4 группы испытуемых, получившие разные неразрешимые анаграммы, не различаются по длительности попыток их решения.

H1: 4 группы испытуемых, получившие разные неразрешимые анаграммы, различаются по длительности попыток их решения.

Теперь познакомимся с «ручным» алгоритмом расчетов.

АЛГОРИТМ Подсчета критерия Н Крускала-Уоллиса

1.Перенести все показатели испытуемых на индивидуальные карточки.

2.Пометить карточки испытуемых группы 1 определенным цветом, например, красным, карточки испытуемых группы 2 - синим, карточки испытуемых групп 3 и 4 - соответственно, зеленым к желтым цветом и т. д. (Можно использовать, естественно, и любые другие обозначения.)

3.Разложить все карточки в единый ряд по степени нарастания признака, несчитаясь с тем, к какой группе относятся карточки, как если бы мы работали с одной объединенной выборкой.

4.Проранжкровать значения на карточках, приписывая меньшему значению меньший ранг. Надписать на каждой карточке ее ранг. Общее количество рангов будет равняться количеству испытуемых в объединенной выборке.

5.Вновь разложить карточки по группам, ориентируясь на цветные или другие принятые обозначения.

6.Подсчитать суммы рангов отдельно по каждой группе. Проверить совпадение общей суммы рангов с расчетной.

7.Подсчитать значение критерия Н по формуле:

где N- общее количество испытуемых в объединенной выборке;

п - количество испытуемых в каждой группе;

Т- суммы рангов по каждой группе.

8а. При количестве групп с=3, n1 ,n2 ,n3 ≤5, определить критические значения и соответствующий им уровень значимости по Табл. III Приложения 1. (Елена Cидоренко Методы математической обработки в психологии) «Критические значения критерия Н Крускала-Уолисса для различных сочетаний n1, n2, n3». Различия между тремя выборками можно считать достоверными на указанном в таблице уровне значимости, если Н эмп достигает соответствующего критического значения или превышает его (по Greene J.< D'Olivera M., 1989).

Если Нэмп равен или превышает критическое значение H0,05, то H0 отвергается.

с - количество выборок.

. При количестве групп с>3 или количестве испытуемых n1,n2,n3 ≤ 5 определить критические значения χ2 по Табл. IX Приложения 1. (Елена Cидоренко Методы математической обработки в психологии) «Критические значения критерия χ2 для уровней статистической значимости   p≤0,05 и p≤0,01 при разном числе степеней свободы V». Различия между двумя распределениями могут считаться достоверными, если χ2 эмп достигает или превышает χ 2 (0,05) и тем более достоверным, если χ2 эмп достигает или превышает χ 2 (0,01) (по Большову Л.Н., Смирнову Н.В., 1983)

Если Нэмп равен или превышает критическое значение χ2 , Н0 отвергается.

Воспользуемся этим алгоритмом при решении задачи о неразрешимых анаграммах. Результаты работы по 1-6 шагам алгоритма представлены в Табл. 2.6.

Таблица 2.6


Дата добавления: 2020-12-12; просмотров: 2305; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!