Глава 2. Практические основы математической обработки результатов психолого-педагогического исследования

2.1. G – критерий знаков

Назначение

G – критерий знаков применяется при выяснении направления сдвига при переходе от первого измерения ко второму на одной и той же выборке испытуемых.

Ограничения

Количество измерений в каждом из двух замеров не менее 5 и не более 300, т.е. 5 ≤ n ₁ ≤ 300 и 5 ≤ n ₂ ≤ 300.

Алгоритм использования

1. Проверить выполнение ограничений;

2. Занести данные измерений в таблицу:

Испытуемые	1	2	3	n
Значения «до воздействия»
Значения «после воздействия»
Сдвиг («после» - «до»)

Сдвиг количественно не подсчитывается, ставится просто, знак разности (« + » или « - »), когда из значения «после воздействия» вычитается значение «до воздействия». Если разность эта равна нулю, то в таблице пишут нуль.

3. Подсчитать количество нулевых реакций n ₀ и вычесть их из объема выборки n. Новый объем выборки найти по формуле: n = n – n ₀;

4. Определить, каких сдвигов больше: положительных или отрицательных. Считать «типичными» те сдвиги, которых больше. А «нетипичными» – те, которых меньше;

5. Сформулировать гипотезы:

Н0: Сдвиг в типичную сторону является случайным;

H1: Сдвиг в типичную сторону является неслучайным.

6. Подсчитать количество «нетипичных» сдвигов и найти эмпирическое значение G – критерия: G эмп. равно количеству «нетипичных» сдвигов;

7. По таблице 2 (см. Приложение) по значению n найти G кр. (p ≤ 0,05) и G кр. (p ≤ 0,01), изобразить все полученные значения на оси значимости.

зона значимости зона неопределенности зона не значимости

Если G эмп. ≤ G кр. на некотором уровне значимости, то H0 отвергается, а H1 принимается на этом уровне значимости.

Если G эмп. > G кр. на некотором уровне значимости, то H0 принимается на том же уровне значимости. Чем меньше G эмп., тем более вероятно, что сдвиг в типичном направлении статистически достоверен.

Замечание

На практике всегда желательно брать группу испытуемых больше пяти человек.

Пример 1. На одной и той же группе испытуемых произведены два замера некоторого признака - «до обучения» и «после обучения». Можно ли считать обучение эффективным, если результаты таковы:

Испытуемые	1	2	3	4	5	6	7	8	9	10
Значения «до»	8	6	3	2	5	5	7	8	10	12
Значения «после»	12	8	3	5	10	4	9	8	9	15

Решение

Оценки испытуемых в общей массе после воздействия возросли, то есть без исследования можно было бы сделать вывод об эффективности обучения.

Так как речь идет об одной группе испытуемых, то следует применить G – критерий знаков, действуя по алгоритму:

1. Проверим ограничения. Так как n = 10 и 5 < 10 < 300, то критерий применим.

2. Заполним таблицу вида:

Испытуемые	1	2	3	4	5	6	7	8	9	10
Значения «до»	8	6	3	2	5	5	7	8	10	12
Значения «после»	12	8	3	5	10	4	9	8	9	15
Сдвиг («после» - «до)	+	+	0	+	+	-	+	0	-	+

3. Подсчитаем количество нулевых реакций и найдем новый объем выборки. Количество n ₀ = 2, значит n = 10 - 2 = 8 – новый объем выборки;

4. Подсчитаем количество положительных и отрицательных сдвигов: сдвигов «+» – 6, сдвигов «-» – 2. Значит, «+» сдвиги – «типичные», а « - » сдвиги – «нетипичные»;

5. Сформулируем гипотезы:

H0: Сдвиг показателей в типичную сторону является случайным;

H1: Сдвиг показателей в типичную сторону является неслучайным.

6. Найдем G эмп., равное количеству «нетипичных сдвигов» – 2;

7. По таблице 2 (см. Приложение) для критерия знаков для n = 8 найдем G кр. (p ≤ 0,05) = 1 и G кр. (p ≤ 0,01) = 0.

Изобразим ось значимости:

зона значимости зона неопределенности зона не значимости

0 1 2

G кр. (p ≤ 0,01) G кр. (p ≤ 0,05) G эмп.

Так как G эмп. > G кp. (p ≤ 0,05), то принимается Н0, т. е. различия случайны.

Вывод: Обучение нельзя считать эффективным.

Пример 2

В эксперименте по непроизвольному запоминанию слов 12 испытуемых (А, Б, В ...) запомнили по разному слова, обозначающие профессии (слесарь, химик, электрик, физик, биолог, геолог, юрист, анатом, токарь, оператор) и обозначающие научные абстракции (гипотеза, суждение, аналогия, теорема, знание, вывод, закон, анализ, аксиома, синтез).

Значимы ли различия в эффективности запоминания этих категорий слов в данной группе испытуемых?

Объем запоминания	испытуемые
Объем запоминания	А	Б	В	Г	Д	Е	Ж	З	И	К	Л	М
Профессии	4	3	3	3	1	3	5	1	4	5	4	2
Научные абстракции	1	4	2	2	2	4	1	4	2	2	0	1

1. Проверим ограничения. Так как n = 12 и 5 < 12 < 300, то критерий применим;

2. Составим таблицу:

Объем запоминания	испытуемые
Объем запоминания	А	Б	В	Г	Д	Е	Ж	З	И	К	Л	М
Профессии	4	3	3	3	1	3	5	1	4	5	4	2
Научные абстракции	1	4	2	2	2	4	1	4	2	2	0	1
Знак разности	+	-	+	+	-	-	+	-	+	+	+	+

3. Подсчитаем количество нулевых реакций: n ₀ = 0, значит n = 12 - 0 = 12;

4. Подсчитаем количество «+» и (-) сдвигов: сдвигов «+ » – 8, сдвигов «-» – 4. Значит, «+» сдвиги – «типичные», а «-), – «нетипичные»;

5. Сформулируем гипотезы:

Н0: Сдвиг показателей в типичную сторону является случайным.

H1: Сдвиг показателей в типичную сторону является неслучайным.

6. Найдем G эмп., равное количеству «нетипичных» сдвигов – 4;

7. По таблице 2 Приложения для n = 12 найдем G кр. (p ≤ 0,05) = 2; G кр. (p ≤ 0,01) = 1

Изобразим ось значимости:

зона значимости зона неопределенности зона не значимости

1 2 4

G кр. (p ≤ 0,01) G кр. (p ≤ 0,05) G эмп.

Так как G эмп. > G кp. (p ≤ 0,05), то принимается Н0, т. е. различия случайны.

Вывод: Преобладание эффективности запоминания профессий по сравнению с эффективностью запоминания научных абстракций не является статистически значимым.

2.2. Т – критерий Вилкоксона

Назначение

Т – критерий Вилкоксона применяется для сопоставления показателей, измеренных на одной и той же выборке, и позволяет оценить не только направленность сдвигов, но и их интенсивность.

Ограничение

Объем выборки должен быть 5 ≤ n ≤ 50.

Алгоритм использования:

1. Проверить выполнение ограничений;

2. Поместить данные в таблицу, записав в первый столбец испытуемых в каком-то определенном порядке (или их коды), во второй – результаты первого замера, а в третий – результаты второго замера:

№ испытуемого

Замер 1

Замер 2

di = «после» - «до»

| di |

Ранг | di |

Ранг «не типичные»

1	2	3	4	5	6	7
1	Х1	Y1	.	.	.	.
2	Х2	Y2	.	.	.	.
3	Х3	Y3	.	.	.	.
…	…	…	…	…	…	…
n	Xi	Yi	.	.	.	.
Суммы	-	-	-	-	Ri = ?	∑Rнетип.=?

3. Вычислить разность между значениями di = «после» - «до» для каждого испытуемого и занести в четвертый столбец. Нулевые сдвиги, если они получились, далее не рассматривать, уменьшить объем выборки на количество нулевых сдвигов n ₀. Новый объем выборки n = n – n ₀.

В пятый столбец записать модули разностей: |di|, затем проранжировать их, приписывая меньшему значению меньший ранг, а равным значениям – равные ранги. Результаты ранжирования записать в шестой столбец таблицы. Проверить совпадение суммы рангов с расчетной суммой по формуле

∑ Ri = n(n + 1) / 2;

4. Определить «типичные» и «нетипичные» сдвиги («типичные» – те, которых больше, «нетипичные» – те, которых меньше). Выписать ранги «нетипичных» сдвигов R нетип. в седьмой столбец таблицы и просуммировать их;

5. Сформулировать гипотезы.

H0: Интенсивность сдвигов в типичном направлении не превышает интенсивность сдвигов в нетипичном направлении.

Н1: Интенсивность сдвигов в типичном направлении превышает интенсивность сдвигов в нетипичном направлении.

6. Подсчитать эмпирическое значение критерия по формуле

Т эмп. = ∑ Rнетип.

7. По таблице 3 Приложения найти T кр. (p ≤ 0,05) и T кр. (p ≤ 0,01) при соответствующем n.

Построить ось значимости:

зона значимости зона неопределенности зона не значимости

Если Т эмп. > Т кр. (p ≤ 0,05), то принимается Н0.

Если Т эмп. ≤ Т кр. на некотором уровне значимости, то Н0 отвергается и принимается Н1 на этом уровне значимости.

Чем меньше Т эмп., тем более вероятно, что сдвиг в типичном направлении статистически достоверен.

Пример 1

На одной и той же группе испытуемых произведены два замера некоторого признака – «до обучения» и «после обучения». Можно ли считать обучение эффективным, если его результаты таковы:

Испытуемые	1	2	3	4	5	6	7	8	9	10
Значения «до»	8	6	3	2	5	5	7	8	9	15
Значения «после»	12	8	3	5	10	4	9	8	9	15

Решение

Используем для решения примера алгоритм Т – критерия:

1. Проверим выполнимость ограничений: 5 ≤ 10 ≤ 50;

2. Запишем данные в таблицу и сделаем необходимые вычисления:

№ испыт.	Замер 1	Замер 2	di = «после» - «до»	\|di\|	Ранг \|di\|	Ранг «нетип.»
1	2	3	4	5	6	7
1	8	12	4	4	7	-
2	6	8	2	2	3,5	-
3	3	3	0	0	-	-
4	2	5	3	3	5,5	-
5	5	10	5	5	8	-
6	5	4	-1	1	1,5	1,5
7	7	9	2	2	3,5	-
8	8	8	0	0	-	-
9	10	9	-1	1	1,5	1,5
10	12	15	3	3	5,5	-
Суммы	-	-	-	-	36	3

В пятом столбце получились числа 4; 2; 0; 3; 5; 1; 2; 0; 1; 3. Исключим нулевые сдвиги и подсчитаем новый объем выборки: n = 10 - 2 = 8;

2. Запишем модули сдвигов в ряд по возрастанию и укажем их места в этом ряду, а затем припишем соответствующие ранги:

\|di\|	Место	Ранг
1	1	1,5
1	2	1,5
2	3	3,5
2	4	3,5
3	5	5,5
3	6	5,5
4	7	7
5	8	8

4. Определим, какие сдвиги являются «типичными», а какие – «нетипичными». Положительных сдвигов больше, их шесть, значит, они «типичные». Отрицательных – меньше, их всего два, значит, они «нетипичные»;

5. Сформулируем гипотезы:

Н0: интенсивность сдвига в типичном направлении не превосходит интенсивность сдвига в нетипичном направлении;

Н1: интенсивность сдвига в типичном направлении превосходит интенсивность сдвига в нетипичном направлении.

6. Подсчитаем Т эмп. = ∑ R нетип. = 1,5 + 1,5 = 3;

7. По числу n и таблице 3 Приложения найдем Т кр. (p ≤ 0,05) = 5 и Т кр. (p ≤ 0,01) = 1.

Построим ось значимости и отметим на ней все найденные значения:

зона значимости зона неопределенности зона не значимости

1 3 5

T кр. (p ≤ 0,01) Т эмп. T кр. (p ≤ 0,05)

Так как Т эмп. < Т кр. (p ≤ 0,05), то Н0 отвергается и принимается Н1, на уровне значимости p ≤ 0,05, то есть сдвиг в типичном направлении более интенсивен, чем сдвиг в нетипичном направлении, что мы можем утверждать с вероятностью, большей 95 %.

Вывод: Обучение можно считать эффективным (с вероятностью, большей 95 %).

С помощью Т – критерия мы выявили неслучайный сдвиг в положительном направлении при воздействии, то есть можно с вероятностью, большей 95%, сказать, что обучение эффективно, но с вероятностью, большей 99 %, этого утверждать нельзя, так как Т эмп. > Т кр. (p ≤ 0,01).

Пример 2

В эксперименте по непроизвольному запоминанию слов 12 испытуемых (А, Б, В ... ) запомнили по-разному слова, обозначающие профессии (слесарь, химик, электрик, физик, геолог, биолог, юрист, анатом, токарь, оператор) и обозначающие научные абстракции (гипотеза, суждение, аналогия, теорема, знание, вывод, закон, анализ, аксиома, синтез).

Объем запоминания	испытуемые
Объем запоминания	А	Б	В	Г	Д	Е	Ж	З	И	К	Л	М
Профессии	4	3	3	5	1	3	5	1	4	5	4	2
Научные абстракции	1	4	2	2	2	4	1	4	2	2	0	1

Значимы ли различия в эффективности запоминания этих категорий слов в данной группе испытуемых?

Решение

1. Проверим выполнимость ограничений: 5 ≤ 12 ≤ 50;

2. Запишем данные в таблицу и сделаем необходимые вычисления:

Профессии	4	3	3	5	1	3	5	1	4	5	4	2
Научные абстракции	1	4	2	2	2	4	1	4	2	2	0	1
Разность	+3	-1	+1	+3	-1	-1	+4	-3	+2	+3	+4	+1
Ранг разности по абсолютной величине	8,5	3	3	8,5	3	3	11,5	8,5	6	8,5	11,5	3

3. Поясним, как записывается нижняя строка. Наименьшее значение разности (- 1), таких значений 5 (независимо от знака), суммируем их номера (1, 2, 3, 4, 5), находим среднее арифметическое (- 3), проставляем всем единицам один и тот же ранг З. Следующий ранг – 6 получает значение разности 2. На ранги 7, 8, 9, 10 претендуют четыре значения 3, их помечаем рангом 8,5. (7 + 8 + 9 + 10)/ 4 = 8,5

4. Определим, какие сдвиги являются «типичными», а какие «нетипичными». Положительных – больше, их 8, значит они – «типичные». Отрицательных – меньше, их всего 4, значит, они – «нетипичные»;

5. Сформулируем гипотезы:

Н1: интенсивность сдвига в типичном направлении превосходит интенсивность сдвига в нетипичном направлении.

6. Подсчитаем Т эмп. = ∑R нетип. = 3 + 3 + 3 + 8,5 = 17,5;

7. По таблице 3 Приложения и n = 12 находим Т кр. (p ≤ 0,05) = 17, Т кр. (p ≤ 0,01) = 9;

Построим ось значимости и отметим на ней все найденные значения:

зона значимости зона неопределенности зона не значимости

9 17… 17,5

T кр. (p ≤ 0,01) T кр. (p ≤ 0,05)……………… Т эмп.

Так как Т эмп. > Т кр. (p ≤ 0,05) и тем более Т эмп. > Т кр. (p ≤ 0,01), следовательно, то Н1 отвергается и принимается Н0, на уровне значимости p ≤ 0,01.

Вывод: различия в величинах объема запоминания разных качеств слов не являются в данной группе испытуемых статистически значимыми.

2.4. Угловой критерий Фишера – φ ^*

Назначение

Угловой φ – критерий Фишера предназначен для сопоставления двух выборок по частоте встречаемости некоторого эффекта, заинтересовавшего исследователя. Особенно удобно его использовать при проверке «отсутствия – наличия эффекта» при сравнении контрольной и экспериментальной групп.

Ограничения

1. Если nA и nB – объемы выборок, то nA ≥ 5, nB ≥ 5. Допускаются также случаи: nA = 2, nB ≥ 30; nA = 3, nB ≥ 7; nA = 4, nB ≥ 5.

2. Ни одна из сопоставляемых долей в каждой выборке не должна быть равна нулю.

Алгоритм использования

1. Проверить выполнимость ограничений для nA и nB;

2. Определить значения признака, которые будут делить испытуемых на тех, у которых «есть эффект». И на тех, у которых «нет эффекта». Подсчитать количество таких испытуемых в группах А и В. Занести данные в таблицу

	«Есть эффект»	«Нет эффекта»	Сумма
Группа А	А	B	A + B
Группа В	С	D	C + D
	А + С	B + D	A + B + C + D

Проверить совпадение контрольной суммы A + B + C + D = nA + nB;

3. Подсчитать процентные доли испытуемых, у которых «есть эффект», и тех, у кого «нет эффекта», в обеих выборках и занести в четырех клеточную таблицу:

	«Есть эффект» (%)	«Нет эффекта» (%)
Группа А	M (%)	K (%)
Группа В	P (%)	Q (%)

Проверить, не равны ли некоторые процентные доли нулю. Если одна из долей равна нулю, то можно сдвинуть точку деления признака на две группы;

4. Сформулировать гипотезы:

Н0: доля испытуемых, у которых «есть эффект» в группе А, не выше доли испытуемых в группе В;

Н1: доля испытуемых, у которых «есть эффект» в группе А, выше доли испытуемых в группе В.

5. По таблице 4 Приложения найти величины углов φ ₁ и φ ₂ для процентной доли тех, у кого «есть эффект», в каждой выборке;

6. Подсчитать эмпирическое значение критерия по формуле

где n ₁ и n ₂ – количество наблюдений (измерений) в 1-й и 2-й выборках; φ ₁ и φ ₂ – значения угла, соответствующие процентным долям Р ₁ и Р ₂ для двух значений эффекта, которые находятся по формуле

где Р – процентная доля, выраженная в долях единицы (например, 60% = 0,6; 40% = 0,4 и т.п.).

7. По таблице 5 Приложения определить р – уровень значимости различий для полученных процентных долей.

Для контроля сравнить φ ^* _эмп с φ ^* _кр(p ≤ 0,05) = 1,64 и φ ^* _кр (p ≤ 0,01) = 2,31.

Изобразить найденные значения на оси значимости:

зона значимости зона неопределенности зона не значимости

Если φ ^* _эмп ≥ φ ^* _крна некотором уровне значимости, то Н0 отвергается на этом уровне значимости. Если φ ^* _эмп ≤ φ ^* _кр (p ≤ 0,05), то принимается Н0.

Пример 1

Имеются две группы детей из параллельных средних групп детского сада, одна из них экспериментальная, другая – контрольная. В экспериментальной группе проводилась работа по развитию пространственных представлений по новой методике, в контрольной группе по обычной методике. После этого в обеих группах давалась задача на прохождение лабиринта. В экспериментальной группе из 20 человек с заданием справились 12, а в контрольной группе из 25 человек с заданием справились 10. Достоверно ли различаются результаты в этих группах?

Решение

1. Проверим выполнимость ограничений:

(n ₁ = 20 > 5 и n ₂ = 25 > 5);

2. Разделим группы детей на части с помощью признака «справился с заданием» и «не справился с заданием». Заполним таблицу:

	«Есть эффект»	«Нет эффекта»	Сумма
Экспериментальная группа	12	8	20
Контрольная группа	10	15	25
	22	23	45

Контрольные суммы совпадают:

A + B + C + D = 12 + 8 + 10 + 15 = 20 + 25 = n₁ + n₂;

3. Подсчитываем процентные доли количества детей, «справившихся с заданием» в экспериментальной и контрольной группах. В экспериментальной группе всего 20 человек, которые составляют 100 %, из них справились с заданием 12 человек, они составляют х %. Тогда

20 / 12 = 100 / х; x = 12∙100 % / 20 = 60 %;

Значит, не справились с заданием в экспериментальной группе

100 % - 60 % =40 %.

Аналогично, в контрольной группе 25 человек, которые составляют 100 %, из них справились с заданием 10 человек, которые составляют y %. Значит,

25 / 10 = 100 / y; y = 10 ∙ 100 % / 25 = 40 %;

Тогда доля, не справившихся с заданием в контрольной группе равна 60 %.

Заполним четырехклеточную таблицу:

	«Есть эффект»	«Нет эффекта»
Экспериментальная группа	60 %	40 %
Контрольная группа	40 %	60 %

Отсюда видно, что ни одна из процентных долей не равна нулю.

4. Сформулируем гипотезы:

Н0: доля испытуемых в экспериментальной группе, у которых «есть эффект», не превосходит доли таких же испытуемых в контрольной группе;

Н1: доля испытуемых в экспериментальной группе, у которых «есть эффект», превосходит долю таких же испытуемых в контрольной группе.

5. По таблице 4 Приложения найти значения φ ₁и φ ₂по процентному содержанию тех испытуемых, у которых «есть эффект»:

φ ₁(60%) = 1,77; φ ₂(40%) = 1,37.

6. Подсчитаем

7. По таблице 5 Приложения найдем уровень значимости различия процентных долей: φ ^* _эмп = 1,34 соответствует уровню значимости p = 0,09.

Для практики этот уровень мал, поэтому следует сравнить φ ^* _эмп с φ ^* _кр (p ≤ 0,05) = 1,64 и φ ^* _кр(p ≤ 0,01) = 2,31 (их тоже найти по таблице 5).

Ось значимости имеет следующий вид:

зона значимости зона неопределенности зона не значимости

1,34 1,64 2,31

φ ^* _эмп φ ^* _кр (p ≤ 0,05) φ ^* _кр (p = 0,01)

Так как φ ^* _эмп < φ ^* _кр (p ≤ 0,05), а тем более φ эмп. < φ ^* _кр (p ≤ 0,01), то принимается Н0 с вероятностью ≥ 99 %.

Доля детей в экспериментальной группе, которые справились с заданием, не выше, чем доля таких детей в контрольной группе. Статистически такой процент различий недостаточен (хотя, на первый взгляд, разница в показателях у них большая – 20 %).

Вывод: Различия в результатах групп статистически незначимы.

Пример 2

В эксперименте по исследованию интермодального переноса получено, что в одной группе испытуемых (nА = 8) более эффективным оказалось тактильное ознакомление с последующим зрительным узнаванием (8 человек из 14), тогда как во второй группе (nВ = 10 чел.) только для трех испытуемых этот вид переноса был эффективнее, чем перенос в направлении зрение-осязание. Значимы ли различия этих двух групп испытуемых в части эффективности переноса осязание-зрение?

Решение

1. Проверим выполнимость ограничений

(nА = 14 > 5 и nB =10 > 5);

	«Есть эффект»	«Нет эффекта»	Сумма
Группа А	8	6	14
Группа В	3	7	10
	11	13	24

Контрольные суммы совпадают:

A + B + C + D = 8 + 6 + 3 + 7 = 14 + 10 = nA + nB;

3. Подсчитаем процентные доли количества детей, «справившихся с заданием» и «не справившихся с заданием) в группе А и группе В. В группе А всего 14 человек, которые составляют 100 %, из них справились с заданием 8 человек, они составляют х %. Тогда:

14 / 3 = 100 / x; x = 8 ∙ 100 % / 14 = 57 %.

Значит, не справились с заданием в экспериментальной группе
100% - 57 % = 43 %.

Аналогично, во второй группе 10 человек, которые составляют 100%, из них справились с заданием 3 человека, которые составляют у %. Значит:

10 / 3 = 100 / y; y = 3 ∙ 100 % / 10 = 30 %.

Тогда доля, не справившихся с заданием в контрольной группе равна 100 % - 30 % = 70 %. Заполним таблицу:

	«Есть эффект»	«Нет эффекта»
Группа А	57%	43%
Группа В	30%	70%

Ни одна из процентных долей не равна нулю.

4. Сформулируем гипотезы:

Н0: доля испытуемых в группе А, у которых «есть эффект», превосходит доли таких же испытуемых в группе В;

Н1: доля испытуемых в группе А, у которых «есть эффект», не превосходит долю таких же испытуемых в группе В;

5. По таблице 4 Приложения найдем значения φ ₁ и φ ₂ по процентному содержанию тех испытуемых, у которых «есть эффект»:

φ ₁ (57 %) = 1,71; φ ₂ (30%) = 1,16.

6. Подсчитаем

7. По таблице 5 Приложения для уровня статистической значимости разных значений φ – критерия найдем уровень значимости различия процентных долей: φ ^* _эмп = 1,33, соответствует уровню значимости p = 0,092.

Сравним φ ^* _эмп с φ ^* _кр (p ≤ 0,05) = 1,64 и φ ^* _кр (p ≤ 0,01) = 2,31.

Ось значимости имеет следующий вид:

зона значимости зона неопределенности зона не значимости

1,33 1,64 2,31

φ ^* _эмп φ ^* _кр (p ≤ 0,05) φ ^* _кр (p ≤ 0,01)

Так как φ ^* _эмп < φ ^* _кр (p ≤ 0,05) и тем более φ ^* _эмп < φ ^* _кр (p ≤ 0,0 1), то принимается Н0

Вывод: Различия в результатах групп статистически незначимы.

2.4. Q – критерий Розенбаума

Назначение

Q – критерий Розенбаума применяется для оценки различий между двумя независимыми выборками по уровню какого-либо признака или свойства, измеренного количественно.

Ограничения

В каждой выборке должно быть не менее 11 наблюдений, т.е. n ₁ ≥ 11, n ₂ ≥ 11,
n ₁ ≈ n ₂.

При этом:

если n ₁ ≤ 50, n ₂ ≤ 50, то (n ₁ – n ₂) ≤ 10;

если 51 ≤ n ₁ ≤ 100, то (n ₁ – n ₂ ) ≤ 20;

если n ₁ ≥ 100, n ₂ ≥ 100, то n ₁ / n ₂ ≤ 1,5, где n ₁ ≥ n ₂.

Алгоритм использования

1. Проверить выполнение ограничений критерия:

(n ₁ ≥ 11, n ₂ ≥ 11, n ₁ ≈ n ₂)

2. Упорядочить значения признака в каждой выборке по убыванию. Определить в каждой выборке максимальное и минимальное значения исследуемого параметра. Считать первой ту выборку, в которой максимальное значение параметра больше, а второй – ту, в которой максимальное значение меньше.

3. Сформулировать гипотезы:

Н0: уровень признака в выборке 1 не превышает уровня признака в выборке 2;

Н1: уровень признака в выборке 1 превышает уровень признака в выборке 2;

4. Подсчитать количество значений (S ₁) в выборке 1, которые больше максимального значения в выборке 2, и количество значений (S ₂) в выборке 2, которые меньше минимального значения в выборке 1;

5. Найти эмпирическое значение Q – критерия Розенбаума по формуле

Q эмп. = S ₁ + S ₂;

6. По таблице 6 Приложения для данных n ₁ и n ₂ определить критические значения критерия с уровнями значимости p ≤ 0,05 и p ≤ 0,01. Сравнить Q эмп. и Q кр.

Если Q кр. ≥ Q кр. на некотором уровне значимости, то Н0 отклоняется на том уровне значимости, на котором вычислено критическое значение, а принимается Н1. Если Q эмп. < Q кр. (p ≤ 0,05), то принимается Н0.

Чем больше значения Q эмп., тем более достоверны различия.

Построить ось значимости:

зона значимости зона неопределенности зона не значимости

Q кр. (p ≤ 0,05) Q кр. (p ≤ 0,01)

Замечание

Q – критерий нежелательно применять тогда, когда максимальное и минимальное значения признака принадлежит одной группе. В этом случае погрешность очень велика.

Пример 1

У двух групп испытуемых (группа А и группа В) измерен по одной и той же методике уровень вербального интеллекта. Можно ли утверждать, что в первой группе оценки выше, чем во второй?

Оценки таковы:

группа А: 121; 104; 115; 116; 115; 109; 115; 109; 108; 112; 112;109.

группа В: 121; 113; 123; 124; 121; 121; 120; 121; 111; 116; 118; 125; 125; 125; 126.

Решение

Так как даны две независимые выборки испытуемых, у которых измерен один и тот же признак, то можно попытаться применить Q – критерий Розенбаума.

1. Проверим выполнимость ограничений:

nA = 12; nB = 15; (nA – nB) = (12 -15) == 3 < 10.

Ограничения выполнены.

2. Упорядочим значения признака по убыванию в каждой выборке и найдем максимальное и минимальное значения признака:

группа А: 121; 116; 115; 115; 115; 112; 112; 109; 109; 109; 108; 104;

группа В: 126; 125; 125; 125; 124; 123; 121; 121; 121;121; 120; 118; 116; 113; 111;

x_max (А) = 121; x_min (A) = 104; x_max (В) = 126; x_min (B) = 111;

Назовем выборкой 1 группу В, выборкой 2 – группу А;

3. Сформулируем гипотезы:

Н0: уровень вербального интеллекта в выборке 1 не выше уровня вербального интеллекта в выборке 2;

H1: уровень вербального интеллекта в выборке 1 выше уровня вербального интеллекта в выборке 2;

4. Подсчитаем S ₁ – количество значений в выборке 1, которые больше max значения в выборке 2, S ₁ = 6, так как шесть значений в выборке 1 больше x_max (2) = 121, а именно: 126, 125, 125, 125, 124, 123.

Так же для S ₂ – количество значений в выборке 2, которые меньше минимального значения в выборке 1. S ₂ = 5, так как в выборке 2 пять значений (109, 109, 109, 108 и 104), меньших x_min (1) = 111;

5. Найдем эмпирическое значение Q – критерия Розенбаума

Q эмп. = S ₁ + S ₂ = 6 + 5 = 11;

6. По таблице 6 Приложения найдем для n ₁ = 12 и n ₂ = 15 Q кр. (p ≤ 0,05) = 7 и Q кр. (p ≤ 0,01) = 9.

Изобразим ось значимости:

зона значимости зона неопределенности зона не значимости

7 9 11

Q кр. (p ≤ 0,05) Q кр. (p ≤ 0,01) Q эмп.

Так как Q эмп. > Q кр. (p ≤ 0,01) (и больше Q кр. (p ≤ 0,05)), то Н0 отвергается, Н1 принимается с уровнем значимости p ≤ 0,01, т.е. различия статистически значимы.

Вывод: Уровень вербального интеллекта испытуемых группы В выше уровня вербального интеллекта испытуемых группы А, причем различия статистически значимы, достоверность получаемых различий более 99 %.

Пример 2

У двух групп испытуемых (группа А и группа В) измерен показатель концентрации внимания:

группа А: 56, 40, 93, 89, 87, 93, 94, 88, 87, 71, 91, 58, 79, 69.

группа В: 74, 61, 74, 99, 75, 61, 74, 79, 70, 96, 45.

Можно ли утверждать, что в одной группе показатель выше, чем в другой?

Решение

Так как даны две независимые выборки испытуемых, у которых измерен один и тот же признак, то можно применить Q – критерий Розенбаума.

1. Проверим выполнимость ограничений:

n ₁ = 14; n ₂ = 11; (n ₁ – n ₂) = (14 -11) =3 < 10.

Ограничения выполнены.

группа А: 94, 93, 93, 91, 89, 88, 87, 87, 79, 71, 69, 58, 56, 40;

группа В: 99, 96, 79, 75, 74, 74, 74, 70, 61, 61, 45;

x_max (А) = 94; x_min (А)= 40; x_max (В) = 99; x_min (B) = 45.

Назовем выборкой 1 группу В, выборкой 2 - группу А.

3. Сформулируем гипотезы:

Н0: показатель концентрации внимания в выборке 1 не выше показателя концентрации внимания в выборке 2;

Н1: показатель концентрации внимания в выборке 1 выше показателя концентрации внимания в выборке 2;

4. Подсчитаем S ₁ – количество значений в выборке 1, которые больше max значения в выборке 2: S ₁ = 2 (96 > 94 и 99 > 94). Аналогично подсчитаем S ₂ – количество значений в выборке 2, которые меньше минимального значения в выборке 1: S ₂ = 1 (40 < 45).

5. Найдем эмпирическое значение Q – критерий Розенбаума:

Q эмп. = S ₁ + S ₂ = 2 + 1 = 3;

6. По таблице 6 Приложения для n ₁ = 14 и n ₂ = 11 найдем Q кр. (p ≤ 0,05) = 7 и Q кр. (p ≤ 0,01) = 9.

Изобразим ось значимости:

зона значимости зона неопределенности зона не значимости

3 7 9

Q эмп. Q кр. (p ≤ 0,05) Q кр. (p ≤ 0,01)

Так как Q эмп. < Q кр. (p ≤ 0,05) и Q эмп. < Q кр. (p ≤ 0;01), то H1 отвергается и принимается Н0, т.е. различия статистически незначимы.

Вывод: Показатель концентрации внимания испытуемых группы В не выше показателя концентрации внимания в группе А.

2.6. U – критерий Манна-Уитни

Назначение

Предназначен для оценки различия величин членов двух выборок. Этот критерий основан на подсчете числа инверсий U (перестановок) членов в их общем упорядоченном ряду.

Ограничения

Объемы выборок должны удовлетворять условиям:

1) n ₁ ≥ 3, n ₂ ≥ 3, но допускается случай n ₁ = 2, n ₂ ≥ 5;

2) n ₁ ≤ 60, n ₂ ≤ 60, но на практике, если n ₁ ≥ 20 и n ₂ ≥ 20, то применение критерия затруднительно.

При больших объемах выборок лучше использовать другие критерии.

Алгоритм использования

1. Проверить ограничения критерия;

2. Объединить выборки А и В в одну общую выборку A U B, пометив принадлежность каждого индивидуального значения к данной группе (цветом, буквой, шифром). Упорядочить значения признака в объединенной выборке по возрастанию и проранжировать все значения, приписывая меньшему значению меньший ранг, а равным значениям – равный ранг;

3. Разделить выборку на две прежние выборки А и В, ориентируясь на пометки. Подсчитать суммы рангов отдельно для каждой из выборок, обозначить их за Та и Тв. Считать первой ту выборку, в которой значение по предварительной оценке выше, а второй – ту, в которой значения ниже. Пусть nА – объем выборки А, а nB – объем выборки В. Если ранжирование и подсчет произведены верно, то должно выполняться контрольное равенство

Та + Тв = (nА + nB) (nА + nB + 1) / 2.

Результаты занести в таблицу:

Значения A U B	х 1	х 2	х 3	…	х n	Суммы
Место	1	2	3		N	…
Ранг	r 1	r 2	r 3	…	r n	…
Выборка				…		…
Ранги А				…		Та = ?
Ранги В				…		Тв = ?

Здесь N = nА + nB – объем объединенной выборки.

4. Сформулировать гипотезы:

Н0: уровень признака в выборке 1 не выше уровня признака в выборке 2;

Н1: уровень признака в выборке 1 выше уровня признака в выборке 2;

5. Вычислить значения U – критерия для каждой из выборок:

Найти U эмп., равное наименьшему из величин Uа и Uв:

U эмп. = min (Ua; Ub);

6. По таблице 7 Приложения по данным n ₁ и n ₂ найти U кр. (p ≤ 0,05) и U кр (p ≤ 0,01). Изобразить на оси значимости все найденные значения критерия.

Если U эмп. ≤ U кр. на некотором уровне значимости, то H0 отвергается, а H1 принимается на этом уровне значимости;

Если U эмп. > U кр. на некотором уровне значимости, то Н0 принимается на том же уровне значимости;

Чем меньше U эмпирический, тем более вероятно, что сдвиг в типичном направлении статистически достоверен.

Пример 1

Даны результаты тестирования двух групп испытуемых А и В по некоторому признаку или свойству:

группа А: 25; 14; 18; 16; 23; 22; 18; 19; nА = 8

группа В: 28; 15; 26; 13; 15; 11; 20; 19; 10; 12; nВ = 10

Можно ли считать, что результаты тестирования в группе В выше, чем в группе А?

Решение

1. Проверим ограничения критерия nА = 8, 8 > 3 и nB = 10, 10 > 3;

2. Объединим значения признака в одну общую выборку, приписывая меньшему значению меньший ранг и равным значениям – равные ранги;

3. Полученные данные занесем в таблицу

Значение	Место	Ранг	Выборка	Ta	Tв
10	1	1	В	-	1
11	2	2	В	-	2
12	3	3	В	-	3
13	4	4	В	-	4
14	5	5	А	5	-
15	6	6,5	В	-	6,5
15	7	6,5	В	-	6,5
16	8	8	А	8	-
18	9	9,5	А	9,5	-
18	10	9,5	А	9,5	-
19	11	11,5	А	11,5	-
19	12	11,5	В	-	11,5
20	13	13	В	-	13
22	14	14	А	14	-
23	15	15	А	15	-
25	16	16	А	16	-
26	17	17	В	-	17
28	18	18	В	-	18
Сумма				88,5	82,5

Подсчитаем сумму рангов в выборке А и в выборке В: Ta = 88,5; Tв = 82,5.

Проверим общую расчетную сумму:

(nА + nB) (nА + nB + 1) / 2 = (8 + 10) (8 + 10 + 1) / 2 = 171;

Та + Тв = 88,5 + 82,5 = 171.

Будем считать выборкой 1 группу В, а выборкой 2 – группу А;

4. Сформулируем гипотезы:

Н0: результаты тестирования в выборке 1 не выше результатов в выборке 2;

Н1: результаты тестирования в выборке 1 выше результатов в выборке 2;

5. Вычислим значения Ua и Uв:

Найдем U эмп. = min (Ua; Uв) = 27,5;

6. По таблице 6 Приложения по данным n ₁= 8 и n ₂ = 10 найдем
U кр (p ≤ 0,05) и U кр. (p ≤ 0,01).

Изобразим на оси значимости все найденные значения критерия.

зона значимости зона неопределенности зона не значимости

13 20 27,5

U кр. (p ≤ 0,01) U кр. (p ≤ 0,05) U эмп.

Так как U эмп. > U кр. (p ≤ 0,05) и U эмп. > U кр. (p ≤ 0,01), то H0 принимается с уровнем значимости p ≤ 0,01, а H1 отвергается.

Значит, результаты тестирования в выборке 1 не выше, чем в выборке 2.

Различия между результатами в выборках статистически не достоверны, то есть случайны.

Вывод: Между результатами групп А и В существенных различий нет.

Если даны три и более выборок, на которых измерен один и тот же признак, то можно сравнить результаты попарно, пользуясь вышеизложенными критериями, или использовать специальные критерии (Крускала Уоллиса или Джонкира).

Пример 2

При измерении пространственных порогов тактильной чувствительности (ощущение прикосновения, давления и вибрации) получены следующие величины порогов для женщин и мужчин:

группа А (женщины) – 32, 30, 28, 30, 33, 37, 28, 27 (nА = 8);

группа В (мужчины) – 39, 36, 31, 35, 29, 34, 38 (nB = 7).

Отличаются ли между собой по величине пороги женщин и мужчин?

Решение

1.Проверим ограничения критерия nА= 8, 8 > 3 и nB = 7, 7 > 3 ;

2. Объединим значения признака в одну общую выборку, упорядочив ее по возрастанию, получим:

27, 28, 28, 29, 30, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39 (n = 15);

3. Проранжируем объединенную выборку, приписывая меньшему значению меньший ранг и равным значениям – равные ранги. Полученные данные занесем в таблицу:

Значение	Место	Ранг	Bыборка	Ta	Tв
27	1	1	А	1	-
28	2	2,5	А	2,5	-
28	3	2,5	А	2,5	-
29	4	4	В	-	4
30	5	5,5	А	5,5	-
30	6	5,5	А	5,5	-
31	7	7	В	-	7
32	8	8	А	8	-
33	9	9	А	9	-
34	10	10	В	-	10
35	11	11	В	-	11
36	12	12	В	-	12
37	13	13	А	13	-
38	14	14	В	-	14
39	15	15	В	-	15
Сумма				47	73

Подсчитаем сумму рангов в выборке А и в выборке В:

Та = 47, Тв = 73.

Проверим общую расчетную сумму:

(nА + nB) (nА + nB + 1) / 2 = (8 + 7) (8 + 7 + 1) / 2 = 120;

Та + Тв = 120.

Будем считать выборкой 1 группу В, а выборкой 2 – группу А;

4. Сформулируем гипотезы:

Н0: результаты измерения в выборке 1 не выше результатов в выборке 2;

Н1: результаты измерения в выборке 1 выше результатов в выборке 2.

5. Вычислим значения Ua и Uв:

По таблице 6 Приложения по n ₁ = 7 и n ₂ = 8 найдем U кр. (p ≤ 0,05) = 13 и
U кр. (p ≤ 0,01) = 7.

Изобразим на оси значимости все найденные значения критерия.

зона значимости зона неопределенности зона не значимости

7 11 13

U кр. (p ≤ 0,01) U эмп. U кр. (p ≤ 0,05)

Вывод: Так как U кр. (p ≤ 0,05) > U эмп. > U кр. (p ≤ 0,01), то можно считать различия величин порогов мужчин и женщин статистически значимыми (p ≤ 0,05).

Дата добавления: 2018-09-22; просмотров: 1048; Мы поможем в написании вашей работы!

Поделиться с друзьями:

⇐ Предыдущая 1 2 3 4 567 Следующая ⇒

Мы поможем в написании ваших работ!