Глава 2. Практические основы математической обработки результатов психолого-педагогического исследования



2.1. G – критерий знаков

Назначение

G – критерий знаков применяется при выяснении направления сдвига при переходе от первого измерения ко второму на одной и той же выборке испытуемых.

Ограничения

Количество измерений в каждом из двух замеров не менее 5 и не более 300, т.е. 5 ≤ n 1 ≤ 300 и 5 ≤ n 2 ≤ 300.

Алгоритм использования

1. Проверить выполнение ограничений;

2. Занести данные измерений в таблицу:

Испытуемые 1 2 3 n
Значения «до воздействия»        
Значения «после воздействия»        
Сдвиг («после» - «до»)        

Сдвиг количественно не подсчитывается, ставится просто, знак разности (« + » или « - »), когда из значения «после воздействия» вычитается значение «до воздействия». Если разность эта равна нулю, то в таблице пишут нуль.

3. Подсчитать количество нулевых реакций n 0 и вычесть их из объема выборки n. Новый объем выборки найти по формуле: n = nn 0;

4. Определить, каких сдвигов больше: положительных или отрицательных. Считать «типичными» те сдвиги, которых больше. А «нетипичными» – те, которых меньше;

5. Сформулировать гипотезы:

Н0: Сдвиг в типичную сторону является случайным;

H1: Сдвиг в типичную сторону является неслучайным.

6. Подсчитать количество «нетипичных» сдвигов и найти эмпирическое значение G – критерия: G эмп. равно количеству «нетипичных» сдвигов;

7. По таблице 2 (см. Приложение) по значению n найти G кр. (p ≤ 0,05) и G кр. (p ≤ 0,01), изобразить все полученные значения на оси значимости.

зона значимости зона неопределенности зона не значимости

Если G эмп. ≤ G кр. на некотором уровне значимости, то H0 отвергается, а H1 принимается на этом уровне значимости.

Если G эмп. > G кр. на некотором уровне значимости, то H0 принимается на том же уровне значимости. Чем меньше G эмп., тем более вероятно, что сдвиг в типичном направлении статистически достоверен.


Замечание

На практике всегда желательно брать группу испытуемых больше пяти человек.

Пример 1. На одной и той же группе испытуемых произведены два замера некоторого признака - «до обучения» и «после обучения». Можно ли считать обучение эффективным, если результаты таковы:

Испытуемые 1 2 3 4 5 6 7 8 9 10
Значения «до» 8 6 3 2 5 5 7 8 10 12
Значения «после» 12 8 3 5 10 4 9 8 9 15

Решение

Оценки испытуемых в общей массе после воздействия возросли, то есть без исследования можно было бы сделать вывод об эффективности обучения.

Так как речь идет об одной группе испытуемых, то следует применить G – критерий знаков, действуя по алгоритму:

1. Проверим ограничения. Так как n = 10 и 5 < 10 < 300, то критерий применим.

2. Заполним таблицу вида:

Испытуемые 1 2 3 4 5 6 7 8 9 10
Значения «до» 8 6 3 2 5 5 7 8 10 12
Значения «после» 12 8 3 5 10 4 9 8 9 15
Сдвиг («после» - «до) + + 0 + + - + 0 - +

3. Подсчитаем количество нулевых реакций и найдем новый объем выборки. Количество n 0 = 2, значит n = 10 - 2 = 8 – новый объем выборки;

4. Подсчитаем количество положительных и отрицательных сдвигов: сдвигов «+» – 6, сдвигов «-» – 2. Значит, «+» сдвиги – «типичные», а « - » сдвиги – «нетипичные»;

5. Сформулируем гипотезы:

H0: Сдвиг показателей в типичную сторону является случайным;

H1: Сдвиг показателей в типичную сторону является неслучайным.

6. Найдем G эмп., равное количеству «нетипичных сдвигов» – 2;

7. По таблице 2 (см. Приложение) для критерия знаков для n = 8 найдем G кр. (p ≤ 0,05) = 1 и G кр. (p ≤ 0,01) = 0.

Изобразим ось значимости:

зона значимости зона неопределенности зона не значимости

0 1 2

G кр. (p ≤ 0,01) G кр. (p ≤ 0,05) G эмп.

Так как G эмп. > G кp. (p ≤ 0,05), то принимается Н0, т. е. различия случайны.

Вывод: Обучение нельзя считать эффективным.

Пример 2

В эксперименте по непроизвольному запоминанию слов 12 испытуемых (А, Б, В ...) запомнили по разному слова, обозначающие профессии (слесарь, химик, электрик, физик, биолог, геолог, юрист, анатом, токарь, оператор) и обозначающие научные абстракции (гипотеза, суждение, аналогия, теорема, знание, вывод, закон, анализ, аксиома, синтез).

Значимы ли различия в эффективности запоминания этих категорий слов в данной группе испытуемых?

Объем запоминания

испытуемые

А Б В Г Д Е Ж З И К Л М
Профессии 4 3 3 3 1 3 5 1 4 5 4 2
Научные абстракции 1 4 2 2 2 4 1 4 2 2 0 1

1. Проверим ограничения. Так как n = 12 и 5 < 12 < 300, то критерий применим;

2. Составим таблицу:

Объем запоминания

испытуемые

А Б В Г Д Е Ж З И К Л М
Профессии 4 3 3 3 1 3 5 1 4 5 4 2
Научные абстракции 1 4 2 2 2 4 1 4 2 2 0 1
Знак разности + - + + - - + - + + + +

3. Подсчитаем количество нулевых реакций: n 0 = 0, значит n = 12 - 0 = 12;

4. Подсчитаем количество «+» и (-) сдвигов: сдвигов «+ » – 8, сдвигов «-» – 4. Значит, «+» сдвиги – «типичные», а «-), – «нетипичные»;

5. Сформулируем гипотезы:

Н0: Сдвиг показателей в типичную сторону является случайным.

H1: Сдвиг показателей в типичную сторону является неслучайным.

6. Найдем G эмп., равное количеству «нетипичных» сдвигов – 4;

7. По таблице 2 Приложения для n = 12 найдем G кр. (p ≤ 0,05) = 2; G кр. (p ≤ 0,01) = 1

Изобразим ось значимости:

зона значимости зона неопределенности зона не значимости

1 2 4

G кр. (p ≤ 0,01) G кр. (p ≤ 0,05) G эмп.

Так как G эмп. > G кp. (p ≤ 0,05), то принимается Н0, т. е. различия случайны.

Вывод: Преобладание эффективности запоминания профессий по сравнению с эффективностью запоминания научных абстракций не является статистически значимым.

2.2. Т – критерий Вилкоксона

Назначение

Т – критерий Вилкоксона применяется для сопоставления показателей, измеренных на одной и той же выборке, и позволяет оценить не только направленность сдвигов, но и их интенсивность.

Ограничение

Объем выборки должен быть 5 ≤ n ≤ 50.

Алгоритм использования:

1. Проверить выполнение ограничений;

2. Поместить данные в таблицу, записав в первый столбец испытуемых в каком-то определенном порядке (или их коды), во второй – результаты первого замера, а в третий – результаты второго замера:

№ испытуемого Замер 1 Замер 2 di = «после» - «до» | di | Ранг | di | Ранг «не типичные»

 

1 2 3 4 5 6 7
1 Х1 Y1 . . . .
2 Х2 Y2 . . . .
3 Х3 Y3 . . . .
n Xi Yi . . . .
Суммы - - - - Ri = ? Rнетип.=?

3. Вычислить разность между значениями di = «после» - «до» для каждого испытуемого и занести в четвертый столбец. Нулевые сдвиги, если они получились, далее не рассматривать, уменьшить объем выборки на количество нулевых сдвигов n 0. Новый объем выборки n = nn 0.

В пятый столбец записать модули разностей: |di|, затем проранжировать их, приписывая меньшему значению меньший ранг, а равным значениям – равные ранги. Результаты ранжирования записать в шестой столбец таблицы. Проверить совпадение суммы рангов с расчетной суммой по формуле

Ri = n(n + 1) / 2;

4. Определить «типичные» и «нетипичные» сдвиги («типичные» – те, которых больше, «нетипичные» – те, которых меньше). Выписать ранги «нетипичных» сдвигов R нетип. в седьмой столбец таблицы и просуммировать их;

5. Сформулировать гипотезы.

H0: Интенсивность сдвигов в типичном направлении не превышает интенсивность сдвигов в нетипичном направлении.

Н1: Интенсивность сдвигов в типичном направлении превышает интенсивность сдвигов в нетипичном направлении.

6. Подсчитать эмпирическое значение критерия по формуле

Т эмп. = ∑ Rнетип.

7. По таблице 3 Приложения найти T кр. (p ≤ 0,05) и T кр. (p ≤ 0,01) при соответствующем n.

Построить ось значимости:

зона значимости зона неопределенности зона не значимости

Если Т эмп. > Т кр. (p ≤ 0,05), то принимается Н0.

Если Т эмп. ≤ Т кр. на некотором уровне значимости, то Н0 отвергается и принимается Н1 на этом уровне значимости.

Чем меньше Т эмп., тем более вероятно, что сдвиг в типичном направлении статистически достоверен.

Пример 1

На одной и той же группе испытуемых произведены два замера некоторого признака – «до обучения» и «после обучения». Можно ли считать обучение эффективным, если его результаты таковы:

Испытуемые 1 2 3 4 5 6 7 8 9 10
Значения «до» 8 6 3 2 5 5 7 8 9 15
Значения «после» 12 8 3 5 10 4 9 8 9 15

Решение

Используем для решения примера алгоритм Т – критерия:

1. Проверим выполнимость ограничений: 5 ≤ 10 ≤ 50;

2. Запишем данные в таблицу и сделаем необходимые вычисления:

№ испыт. Замер 1 Замер 2 di = «после» - «до» |di| Ранг |di| Ранг «нетип.»
1 2 3 4 5 6 7
1 8 12 4 4 7 -
2 6 8 2 2 3,5 -
3 3 3 0 0 - -
4 2 5 3 3 5,5 -
5 5 10 5 5 8 -
6 5 4 -1 1 1,5 1,5
7 7 9 2 2 3,5 -
8 8 8 0 0 - -
9 10 9 -1 1 1,5 1,5
10 12 15 3 3 5,5 -
Суммы - - - - 36 3

В пятом столбце получились числа 4; 2; 0; 3; 5; 1; 2; 0; 1; 3. Исключим нулевые сдвиги и подсчитаем новый объем выборки: n = 10 - 2 = 8;

2. Запишем модули сдвигов в ряд по возрастанию и укажем их места в этом ряду, а затем припишем соответствующие ранги:

|di| Место Ранг
1 1 1,5
1 2 1,5
2 3 3,5
2 4 3,5
3 5 5,5
3 6 5,5
4 7 7
5 8 8

4. Определим, какие сдвиги являются «типичными», а какие – «нетипичными». Положительных сдвигов больше, их шесть, значит, они «типичные». Отрицательных – меньше, их всего два, значит, они «нетипичные»;

5. Сформулируем гипотезы:

Н0: интенсивность сдвига в типичном направлении не превосходит интенсивность сдвига в нетипичном направлении;

Н1: интенсивность сдвига в типичном направлении превосходит интенсивность сдвига в нетипичном направлении.

6. Подсчитаем Т эмп. = ∑ R нетип. = 1,5 + 1,5 = 3;

7. По числу n и таблице 3 Приложения найдем Т кр. (p ≤ 0,05) = 5 и Т кр. (p ≤ 0,01) = 1.

Построим ось значимости и отметим на ней все найденные значения:

зона значимости зона неопределенности зона не значимости

1 3 5

T кр. (p ≤ 0,01) Т эмп. T кр. (p ≤ 0,05)

Так как Т эмп. < Т кр. (p ≤ 0,05), то Н0 отвергается и принимается Н1, на уровне значимости p ≤ 0,05, то есть сдвиг в типичном направлении более интенсивен, чем сдвиг в нетипичном направлении, что мы можем утверждать с вероятностью, большей 95 %.

Вывод: Обучение можно считать эффективным (с вероятностью, большей 95 %).

С помощью Т – критерия мы выявили неслучайный сдвиг в положительном направлении при воздействии, то есть можно с вероятностью, большей 95%, сказать, что обучение эффективно, но с вероятностью, большей 99 %, этого утверждать нельзя, так как Т эмп. > Т кр. (p ≤ 0,01).

Пример 2

В эксперименте по непроизвольному запоминанию слов 12 испытуемых (А, Б, В ... ) запомнили по-разному слова, обозначающие профессии (слесарь, химик, электрик, физик, геолог, биолог, юрист, анатом, токарь, оператор) и обозначающие научные абстракции (гипотеза, суждение, аналогия, теорема, знание, вывод, закон, анализ, аксиома, синтез).

Объем запоминания

испытуемые

А Б В Г Д Е Ж З И К Л М
Профессии 4 3 3 5 1 3 5 1 4 5 4 2
Научные абстракции 1 4 2 2 2 4 1 4 2 2 0 1

Значимы ли различия в эффективности запоминания этих категорий слов в данной группе испытуемых?

Решение

1. Проверим выполнимость ограничений: 5 ≤ 12 ≤ 50;

2. Запишем данные в таблицу и сделаем необходимые вычисления:

Профессии 4 3 3 5 1 3 5 1 4 5 4 2
Научные абстракции 1 4 2 2 2 4 1 4 2 2 0 1
Разность +3 -1 +1 +3 -1 -1 +4 -3 +2 +3 +4 +1
Ранг разности по абсолютной величине 8,5 3 3 8,5 3 3 11,5 8,5 6 8,5 11,5 3

3. Поясним, как записывается нижняя строка. Наименьшее значение разности (- 1), таких значений 5 (независимо от знака), суммируем их номера (1, 2, 3, 4, 5), находим среднее арифметическое (- 3), проставляем всем единицам один и тот же ранг З. Следующий ранг – 6 получает значение разности 2. На ранги 7, 8, 9, 10 претендуют четыре значения 3, их помечаем рангом 8,5. (7 + 8 + 9 + 10)/ 4 = 8,5

4. Определим, какие сдвиги являются «типичными», а какие «нетипичными». Положительных – больше, их 8, значит они – «типичные». Отрицательных – меньше, их всего 4, значит, они – «нетипичные»;

5. Сформулируем гипотезы:

Н0: интенсивность сдвига в типичном направлении не превосходит интенсивность сдвига в нетипичном направлении;

Н1: интенсивность сдвига в типичном направлении превосходит интенсивность сдвига в нетипичном направлении.

6. Подсчитаем Т эмп. = ∑R нетип. = 3 + 3 + 3 + 8,5 = 17,5;

7. По таблице 3 Приложения и n = 12 находим Т кр. (p ≤ 0,05) = 17, Т кр. (p ≤ 0,01) = 9;

Построим ось значимости и отметим на ней все найденные значения:

зона значимости зона неопределенности зона не значимости

9 17… 17,5

T кр. (p ≤ 0,01) T кр. (p ≤ 0,05)……………… Т эмп.

Так как Т эмп. > Т кр. (p ≤ 0,05) и тем более Т эмп. > Т кр. (p ≤ 0,01), следовательно, то Н1 отвергается и принимается Н0, на уровне значимости p ≤ 0,01.

Вывод: различия в величинах объема запоминания разных качеств слов не являются в данной группе испытуемых статистически значимыми.

2.4. Угловой критерий Фишера – φ *

Назначение

Угловой φ – критерий Фишера предназначен для сопоставления двух выборок по частоте встречаемости некоторого эффекта, заинтересовавшего исследователя. Особенно удобно его использовать при проверке «отсутствия – наличия эффекта» при сравнении контрольной и экспериментальной групп.

Ограничения

1. Если nA и nB – объемы выборок, то nA ≥ 5, nB ≥ 5. Допускаются также случаи: nA = 2, nB ≥ 30; nA = 3, nB ≥ 7; nA = 4, nB ≥ 5.

2. Ни одна из сопоставляемых долей в каждой выборке не должна быть равна нулю.

Алгоритм использования

1. Проверить выполнимость ограничений для nA и nB;

2. Определить значения признака, которые будут делить испытуемых на тех, у которых «есть эффект». И на тех, у которых «нет эффекта». Подсчитать количество таких испытуемых в группах А и В. Занести данные в таблицу

  «Есть эффект» «Нет эффекта» Сумма
Группа А А B A + B
Группа В С D C + D
  А + С B + D A + B + C + D

Проверить совпадение контрольной суммы A + B + C + D = nA + nB;

3. Подсчитать процентные доли испытуемых, у которых «есть эффект», и тех, у кого «нет эффекта», в обеих выборках и занести в четырех клеточную таблицу:

  «Есть эффект» (%) «Нет эффекта» (%)
Группа А M (%) K (%)
Группа В P (%) Q (%)

Проверить, не равны ли некоторые процентные доли нулю. Если одна из долей равна нулю, то можно сдвинуть точку деления признака на две группы;

4. Сформулировать гипотезы:

Н0: доля испытуемых, у которых «есть эффект» в группе А, не выше доли испытуемых в группе В;

Н1: доля испытуемых, у которых «есть эффект» в группе А, выше доли испытуемых в группе В.

5. По таблице 4 Приложения найти величины углов φ 1 и φ 2 для процентной доли тех, у кого «есть эффект», в каждой выборке;

6. Подсчитать эмпирическое значение критерия по формуле

где n 1 и n 2 – количество наблюдений (измерений) в 1-й и 2-й выборках; φ 1 и φ 2 – значения угла, соответствующие процентным долям Р 1 и Р 2 для двух значений эффекта, которые находятся по формуле

где Р – процентная доля, выраженная в долях единицы (например, 60% = 0,6; 40% = 0,4 и т.п.).

7. По таблице 5 Приложения определить р – уровень значимости различий для полученных процентных долей.

Для контроля сравнить φ * эмп с φ * кр(p ≤ 0,05) = 1,64 и φ * кр (p ≤ 0,01) = 2,31.

Изобразить найденные значения на оси значимости:

зона значимости зона неопределенности зона не значимости

Если φ * эмпφ * крна некотором уровне значимости, то Н0 отвергается на этом уровне значимости. Если φ * эмпφ * кр (p ≤ 0,05), то принимается Н0.

Пример 1

Имеются две группы детей из параллельных средних групп детского сада, одна из них экспериментальная, другая – контрольная. В экспериментальной группе проводилась работа по развитию пространственных представлений по новой методике, в контрольной группе по обычной методике. После этого в обеих группах давалась задача на прохождение лабиринта. В экспериментальной группе из 20 человек с заданием справились 12, а в контрольной группе из 25 человек с заданием справились 10. Достоверно ли различаются результаты в этих группах?

Решение

1. Проверим выполнимость ограничений:

(n 1 = 20 > 5 и n 2 = 25 > 5);

2. Разделим группы детей на части с помощью признака «справился с заданием» и «не справился с заданием». Заполним таблицу:

  «Есть эффект» «Нет эффекта» Сумма
Экспериментальная группа 12 8 20
Контрольная группа 10 15 25
  22 23 45

Контрольные суммы совпадают:

A + B + C + D = 12 + 8 + 10 + 15 = 20 + 25 = n1 + n2;

3. Подсчитываем процентные доли количества детей, «справившихся с заданием» в экспериментальной и контрольной группах. В экспериментальной группе всего 20 человек, которые составляют 100 %, из них справились с заданием 12 человек, они составляют х %. Тогда

20 / 12 = 100 / х; x = 12∙100 % / 20 = 60 %;

Значит, не справились с заданием в экспериментальной группе

100 % - 60 % =40 %.

Аналогично, в контрольной группе 25 человек, которые составляют 100 %, из них справились с заданием 10 человек, которые составляют y %. Значит,

25 / 10 = 100 / y; y = 10 ∙ 100 % / 25 = 40 %;

Тогда доля, не справившихся с заданием в контрольной группе равна 60 %.

Заполним четырехклеточную таблицу:

  «Есть эффект» «Нет эффекта»
Экспериментальная группа 60 % 40 %
Контрольная группа 40 % 60 %

Отсюда видно, что ни одна из процентных долей не равна нулю.

4. Сформулируем гипотезы:

Н0: доля испытуемых в экспериментальной группе, у которых «есть эффект», не превосходит доли таких же испытуемых в контрольной группе;

Н1: доля испытуемых в экспериментальной группе, у которых «есть эффект», превосходит долю таких же испытуемых в контрольной группе.

5. По таблице 4 Приложения найти значения φ 1 и φ 2 по процентному содержанию тех испытуемых, у которых «есть эффект»:

φ 1 (60%) = 1,77; φ 2 (40%) = 1,37.

6. Подсчитаем

7. По таблице 5 Приложения найдем уровень значимости различия процентных долей: φ * эмп = 1,34 соответствует уровню значимости p = 0,09.

Для практики этот уровень мал, поэтому следует сравнить φ * эмп с φ * кр (p ≤ 0,05) = 1,64 и φ * кр (p ≤ 0,01) = 2,31 (их тоже найти по таблице 5).

Ось значимости имеет следующий вид:

зона значимости зона неопределенности зона не значимости

1,34 1,64 2,31

φ * эмп φ * кр (p ≤ 0,05) φ * кр (p = 0,01)

Так как φ * эмп < φ * кр (p ≤ 0,05), а тем более φ эмп. < φ * кр (p ≤ 0,01), то принимается Н0 с вероятностью ≥ 99 %.

Доля детей в экспериментальной группе, которые справились с заданием, не выше, чем доля таких детей в контрольной группе. Статистически такой процент различий недостаточен (хотя, на первый взгляд, разница в показателях у них большая – 20 %).

Вывод: Различия в результатах групп статистически незначимы.

Пример 2

В эксперименте по исследованию интермодального переноса получено, что в одной группе испытуемых (nА = 8) более эффективным оказалось тактильное ознакомление с последующим зрительным узнаванием (8 человек из 14), тогда как во второй группе (nВ = 10 чел.) только для трех испытуемых этот вид переноса был эффективнее, чем перенос в направлении зрение-осязание. Значимы ли различия этих двух групп испытуемых в части эффективности переноса осязание-зрение?

Решение

1. Проверим выполнимость ограничений

(nА = 14 > 5 и nB =10 > 5);

2. Разделим группы детей на части с помощью признака «справился с заданием» и «не справился с заданием». Заполним таблицу:

  «Есть эффект» «Нет эффекта» Сумма
Группа А 8 6 14
Группа В 3 7 10
  11 13 24

Контрольные суммы совпадают:

A + B + C + D = 8 + 6 + 3 + 7 = 14 + 10 = nA + nB;

3. Подсчитаем процентные доли количества детей, «справившихся с заданием» и «не справившихся с заданием) в группе А и группе В. В группе А всего 14 человек, которые составляют 100 %, из них справились с заданием 8 человек, они составляют х %. Тогда:

14 / 3 = 100 / x; x = 8 ∙ 100 % / 14 = 57 %.

Значит, не справились с заданием в экспериментальной группе
100% - 57 % = 43 %.

Аналогично, во второй группе 10 человек, которые составляют 100%, из них справились с заданием 3 человека, которые составляют у %. Значит:

10 / 3 = 100 / y; y = 3 ∙ 100 % / 10 = 30 %.

Тогда доля, не справившихся с заданием в контрольной группе равна 100 % - 30 % = 70 %. Заполним таблицу:

  «Есть эффект» «Нет эффекта»
Группа А 57% 43%
Группа В 30% 70%

Ни одна из процентных долей не равна нулю.

4. Сформулируем гипотезы:

Н0: доля испытуемых в группе А, у которых «есть эффект», превосходит доли таких же испытуемых в группе В;

Н1: доля испытуемых в группе А, у которых «есть эффект», не превосходит долю таких же испытуемых в группе В;

5. По таблице 4 Приложения найдем значения φ 1 и φ 2 по процентному содержанию тех испытуемых, у которых «есть эффект»:

φ 1 (57 %) = 1,71; φ 2 (30%) = 1,16.

6. Подсчитаем

7. По таблице 5 Приложения для уровня статистической значимости разных значений φ – критерия найдем уровень значимости различия процентных долей: φ * эмп = 1,33, соответствует уровню значимости p = 0,092.

Сравним φ * эмп с φ * кр (p ≤ 0,05) = 1,64 и φ * кр (p ≤ 0,01) = 2,31.

Ось значимости имеет следующий вид:

зона значимости зона неопределенности зона не значимости

1,33 1,64 2,31

φ * эмп φ * кр (p ≤ 0,05) φ * кр (p ≤ 0,01)

Так как φ * эмп < φ * кр (p ≤ 0,05) и тем более φ * эмп < φ * кр (p ≤ 0,0 1), то принимается Н0

Вывод: Различия в результатах групп статистически незначимы.


2.4. Q – критерий Розенбаума

Назначение

Q – критерий Розенбаума применяется для оценки различий между двумя независимыми выборками по уровню какого-либо признака или свойства, измеренного количественно.

Ограничения

В каждой выборке должно быть не менее 11 наблюдений, т.е. n 1 ≥ 11, n 2 ≥ 11,
n 1n 2.

При этом:

если n 1 ≤ 50, n 2 ≤ 50, то (n 1n 2) ≤ 10;

если 51 ≤ n 1 ≤ 100, то (n 1 n 2 ) ≤ 20;

если n 1 ≥ 100, n 2 ≥ 100, то n 1 / n 2 ≤ 1,5, где n 1n 2.

Алгоритм использования

1. Проверить выполнение ограничений критерия:

(n 1 ≥ 11, n 2 ≥ 11, n 1n 2)

2. Упорядочить значения признака в каждой выборке по убыванию. Определить в каждой выборке максимальное и минимальное значения исследуемого параметра. Считать первой ту выборку, в которой максимальное значение параметра больше, а второй – ту, в которой максимальное значение меньше.

3. Сформулировать гипотезы:

Н0: уровень признака в выборке 1 не превышает уровня признака в выборке 2;

Н1: уровень признака в выборке 1 превышает уровень признака в выборке 2;

4. Подсчитать количество значений (S 1) в выборке 1, которые больше максимального значения в выборке 2, и количество значений (S 2) в выборке 2, которые меньше минимального значения в выборке 1;

5. Найти эмпирическое значение Q – критерия Розенбаума по формуле

Q эмп. = S 1 + S 2;

6. По таблице 6 Приложения для данных n 1 и n 2 определить критические значения критерия с уровнями значимости p ≤ 0,05 и p ≤ 0,01. Сравнить Q эмп. и Q кр.

Если Q кр. ≥ Q кр. на некотором уровне значимости, то Н0 отклоняется на том уровне значимости, на котором вычислено критическое значение, а принимается Н1. Если Q эмп. < Q кр. (p ≤ 0,05), то принимается Н0.

Чем больше значения Q эмп., тем более достоверны различия.

Построить ось значимости:

зона значимости зона неопределенности зона не значимости

Q кр. (p ≤ 0,05) Q кр. (p ≤ 0,01)

Замечание

Q – критерий нежелательно применять тогда, когда максимальное и минимальное значения признака принадлежит одной группе. В этом случае погрешность очень велика.

Пример 1

У двух групп испытуемых (группа А и группа В) измерен по одной и той же методике уровень вербального интеллекта. Можно ли утверждать, что в первой группе оценки выше, чем во второй?

Оценки таковы:

группа А: 121; 104; 115; 116; 115; 109; 115; 109; 108; 112; 112;109.

группа В: 121; 113; 123; 124; 121; 121; 120; 121; 111; 116; 118; 125; 125; 125; 126.

Решение

Так как даны две независимые выборки испытуемых, у которых измерен один и тот же признак, то можно попытаться применить Q – критерий Розенбаума.

1. Проверим выполнимость ограничений:

nA = 12; nB = 15; (nA – nB) = (12 -15) == 3 < 10.

Ограничения выполнены.

2. Упорядочим значения признака по убыванию в каждой выборке и найдем максимальное и минимальное значения признака:

группа А: 121; 116; 115; 115; 115; 112; 112; 109; 109; 109; 108; 104;

группа В: 126; 125; 125; 125; 124; 123; 121; 121; 121;121; 120; 118; 116; 113; 111;

xmax (А) = 121; xmin (A) = 104; xmax (В) = 126; xmin (B) = 111;

Назовем выборкой 1 группу В, выборкой 2 – группу А;

3. Сформулируем гипотезы:

Н0: уровень вербального интеллекта в выборке 1 не выше уровня вербального интеллекта в выборке 2;

H1: уровень вербального интеллекта в выборке 1 выше уровня вербального интеллекта в выборке 2;

4. Подсчитаем S 1 – количество значений в выборке 1, которые больше max значения в выборке 2, S 1 = 6, так как шесть значений в выборке 1 больше xmax (2) = 121, а именно: 126, 125, 125, 125, 124, 123.

Так же для S 2 – количество значений в выборке 2, которые меньше минимального значения в выборке 1. S 2 = 5, так как в выборке 2 пять значений (109, 109, 109, 108 и 104), меньших xmin (1) = 111;

5. Найдем эмпирическое значение Q – критерия Розенбаума

Q эмп. = S 1 + S 2 = 6 + 5 = 11;

6. По таблице 6 Приложения найдем для n 1 = 12 и n 2 = 15 Q кр. (p ≤ 0,05) = 7 и Q кр. (p ≤ 0,01) = 9.

Изобразим ось значимости:

зона значимости зона неопределенности зона не значимости

7 9 11

Q кр. (p ≤ 0,05) Q кр. (p ≤ 0,01) Q эмп.

Так как Q эмп. > Q кр. (p ≤ 0,01) (и больше Q кр. (p ≤ 0,05)), то Н0 отвергается, Н1 принимается с уровнем значимости p ≤ 0,01, т.е. различия статистически значимы.

Вывод: Уровень вербального интеллекта испытуемых группы В выше уровня вербального интеллекта испытуемых группы А, причем различия статистически значимы, достоверность получаемых различий более 99 %.

Пример 2

У двух групп испытуемых (группа А и группа В) измерен показатель концентрации внимания:

группа А: 56, 40, 93, 89, 87, 93, 94, 88, 87, 71, 91, 58, 79, 69.

группа В: 74, 61, 74, 99, 75, 61, 74, 79, 70, 96, 45.

Можно ли утверждать, что в одной группе показатель выше, чем в другой?

Решение

Так как даны две независимые выборки испытуемых, у которых измерен один и тот же признак, то можно применить Q – критерий Розенбаума.

1. Проверим выполнимость ограничений:

n 1 = 14; n 2 = 11; (n 1 n 2) = (14 -11) =3 < 10.

Ограничения выполнены.

2. Упорядочим значения признака по убыванию в каждой выборке и найдем максимальное и минимальное значения признака:

группа А: 94, 93, 93, 91, 89, 88, 87, 87, 79, 71, 69, 58, 56, 40;

группа В: 99, 96, 79, 75, 74, 74, 74, 70, 61, 61, 45;

xmax (А) = 94; xmin (А)= 40; xmax (В) = 99; xmin (B) = 45.

Назовем выборкой 1 группу В, выборкой 2 - группу А.

3. Сформулируем гипотезы:

Н0: показатель концентрации внимания в выборке 1 не выше показателя концентрации внимания в выборке 2;

Н1: показатель концентрации внимания в выборке 1 выше показателя концентрации внимания в выборке 2;

4. Подсчитаем S 1 – количество значений в выборке 1, которые больше max значения в выборке 2: S 1 = 2 (96 > 94 и 99 > 94). Аналогично подсчитаем S 2 – количество значений в выборке 2, которые меньше минимального значения в выборке 1: S 2 = 1 (40 < 45).

5. Найдем эмпирическое значение Q – критерий Розенбаума:

Q эмп. = S 1 + S 2 = 2 + 1 = 3;

6. По таблице 6 Приложения для n 1 = 14 и n 2 = 11 найдем Q кр. (p ≤ 0,05) = 7 и Q кр. (p ≤ 0,01) = 9.

Изобразим ось значимости:

зона значимости зона неопределенности зона не значимости

3 7 9

Q эмп. Q кр. (p ≤ 0,05) Q кр. (p ≤ 0,01)

Так как Q эмп. < Q кр. (p ≤ 0,05) и Q эмп. < Q кр. (p ≤ 0;01), то H1 отвергается и принимается Н0, т.е. различия статистически незначимы.

Вывод: Показатель концентрации внимания испытуемых группы В не выше показателя концентрации внимания в группе А.

2.6. U – критерий Манна-Уитни

Назначение

Предназначен для оценки различия величин членов двух выборок. Этот критерий основан на подсчете числа инверсий U (перестановок) членов в их общем упорядоченном ряду.

Ограничения

Объемы выборок должны удовлетворять условиям:

1) n 1 ≥ 3, n 2 ≥ 3, но допускается случай n 1 = 2, n 2 ≥ 5;

2) n 1 ≤ 60, n 2 ≤ 60, но на практике, если n 1 ≥ 20 и n 2 ≥ 20, то применение критерия затруднительно.

При больших объемах выборок лучше использовать другие критерии.

Алгоритм использования

1. Проверить ограничения критерия;

2. Объединить выборки А и В в одну общую выборку A U B, пометив принадлежность каждого индивидуального значения к данной группе (цветом, буквой, шифром). Упорядочить значения признака в объединенной выборке по возрастанию и проранжировать все значения, приписывая меньшему значению меньший ранг, а равным значениям – равный ранг;

3. Разделить выборку на две прежние выборки А и В, ориентируясь на пометки. Подсчитать суммы рангов отдельно для каждой из выборок, обозначить их за Та и Тв. Считать первой ту выборку, в которой значение по предварительной оценке выше, а второй – ту, в которой значения ниже. Пусть nА – объем выборки А, а nB – объем выборки В. Если ранжирование и подсчет произведены верно, то должно выполняться контрольное равенство

Та + Тв = (nА + nB) (nА + nB + 1) / 2.

Результаты занести в таблицу:

Значения A U B х 1 х 2 х 3 х n Суммы
Место 1 2 3   N
Ранг r 1 r 2 r 3 r n
Выборка        
Ранги А         Та = ?
Ранги В         Тв = ?

Здесь N = nА + nB – объем объединенной выборки.

4. Сформулировать гипотезы:

Н0: уровень признака в выборке 1 не выше уровня признака в выборке 2;

Н1: уровень признака в выборке 1 выше уровня признака в выборке 2;

5. Вычислить значения U – критерия для каждой из выборок:

Найти U эмп., равное наименьшему из величин Uа и Uв:

U эмп. = min (Ua; Ub);

6. По таблице 7 Приложения по данным n 1 и n 2 найти U кр. (p ≤ 0,05) и U кр (p ≤ 0,01). Изобразить на оси значимости все найденные значения критерия.

Если U эмп. ≤ U кр. на некотором уровне значимости, то H0 отвергается, а H1 принимается на этом уровне значимости;

Если U эмп. > U кр. на некотором уровне значимости, то Н0 принимается на том же уровне значимости;

Чем меньше U эмпирический, тем более вероятно, что сдвиг в типичном направлении статистически достоверен.

Пример 1

Даны результаты тестирования двух групп испытуемых А и В по некоторому признаку или свойству:

группа А: 25; 14; 18; 16; 23; 22; 18; 19; nА = 8

группа В: 28; 15; 26; 13; 15; 11; 20; 19; 10; 12; nВ = 10

Можно ли считать, что результаты тестирования в группе В выше, чем в группе А?

Решение

1. Проверим ограничения критерия nА = 8, 8 > 3 и nB = 10, 10 > 3;

2. Объединим значения признака в одну общую выборку, приписывая меньшему значению меньший ранг и равным значениям – равные ранги;

3. Полученные данные занесем в таблицу

Значение Место Ранг Выборка Ta
10 1 1 В - 1
11 2 2 В - 2
12 3 3 В - 3
13 4 4 В - 4
14 5 5 А 5 -
15 6 6,5 В - 6,5
15 7 6,5 В - 6,5
16 8 8 А 8 -
18 9 9,5 А 9,5 -
18 10 9,5 А 9,5 -
19 11 11,5 А 11,5 -
19 12 11,5 В - 11,5
20 13 13 В - 13
22 14 14 А 14 -
23 15 15 А 15 -
25 16 16 А 16 -
26 17 17 В - 17
28 18 18 В - 18
Сумма       88,5 82,5

Подсчитаем сумму рангов в выборке А и в выборке В: Ta = 88,5; = 82,5.

Проверим общую расчетную сумму:

(nА + nB) (nА + nB + 1) / 2 = (8 + 10) (8 + 10 + 1) / 2 = 171;

Та + Тв = 88,5 + 82,5 = 171.

Будем считать выборкой 1 группу В, а выборкой 2 – группу А;

4. Сформулируем гипотезы:

Н0: результаты тестирования в выборке 1 не выше результатов в выборке 2;

Н1: результаты тестирования в выборке 1 выше результатов в выборке 2;

5. Вычислим значения Ua и :

Найдем U эмп. = min (Ua; ) = 27,5;

6. По таблице 6 Приложения по данным n 1 = 8 и n 2 = 10 найдем
U кр (p ≤ 0,05) и U кр. (p ≤ 0,01).

Изобразим на оси значимости все найденные значения критерия.

зона значимости зона неопределенности зона не значимости

13 20 27,5

U кр. (p ≤ 0,01) U кр. (p ≤ 0,05) U эмп.

Так как U эмп. > U кр. (p ≤ 0,05) и U эмп. > U кр. (p ≤ 0,01), то H0 принимается с уровнем значимости p ≤ 0,01, а H1 отвергается.

Значит, результаты тестирования в выборке 1 не выше, чем в выборке 2.

Различия между результатами в выборках статистически не достоверны, то есть случайны.

Вывод: Между результатами групп А и В существенных различий нет.

Если даны три и более выборок, на которых измерен один и тот же признак, то можно сравнить результаты попарно, пользуясь вышеизложенными критериями, или использовать специальные критерии (Крускала Уоллиса или Джонкира).

Пример 2

При измерении пространственных порогов тактильной чувствительности (ощущение прикосновения, давления и вибрации) получены следующие величины порогов для женщин и мужчин:

группа А (женщины) – 32, 30, 28, 30, 33, 37, 28, 27 (nА = 8);

группа В (мужчины) – 39, 36, 31, 35, 29, 34, 38 (nB = 7).

Отличаются ли между собой по величине пороги женщин и мужчин?

Решение

1.Проверим ограничения критерия nА= 8, 8 > 3 и nB = 7, 7 > 3 ;

2. Объединим значения признака в одну общую выборку, упорядочив ее по возрастанию, получим:

27, 28, 28, 29, 30, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39 (n = 15);

3. Проранжируем объединенную выборку, приписывая меньшему значению меньший ранг и равным значениям – равные ранги. Полученные данные занесем в таблицу:

Значение Место Ранг Bыборка Ta
27 1 1 А 1 -
28 2 2,5 А 2,5 -
28 3 2,5 А 2,5 -
29 4 4 В - 4
30 5 5,5 А 5,5 -
30 6 5,5 А 5,5 -
31 7 7 В - 7
32 8 8 А 8 -
33 9 9 А 9 -
34 10 10 В - 10
35 11 11 В - 11
36 12 12 В - 12
37 13 13 А 13 -
38 14 14 В - 14
39 15 15 В - 15
Сумма       47 73

Подсчитаем сумму рангов в выборке А и в выборке В:

Та = 47, Тв = 73.

Проверим общую расчетную сумму:

(nА + nB) (nА + nB + 1) / 2 = (8 + 7) (8 + 7 + 1) / 2 = 120;

Та + Тв = 120.

Будем считать выборкой 1 группу В, а выборкой 2 – группу А;

4. Сформулируем гипотезы:

Н0: результаты измерения в выборке 1 не выше результатов в выборке 2;

Н1: результаты измерения в выборке 1 выше результатов в выборке 2.

5. Вычислим значения Ua и :

По таблице 6 Приложения по n 1 = 7 и n 2 = 8 найдем U кр. (p ≤ 0,05) = 13 и
U кр. (p ≤ 0,01) = 7.

Изобразим на оси значимости все найденные значения критерия.

зона значимости зона неопределенности зона не значимости

7 11 13

U кр. (p ≤ 0,01) U эмп. U кр. (p ≤ 0,05)

Вывод: Так как U кр. (p ≤ 0,05) > U эмп. > U кр. (p ≤ 0,01), то можно считать различия величин порогов мужчин и женщин статистически значимыми (p ≤ 0,05).


Дата добавления: 2018-09-22; просмотров: 1048; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!