Глава 2. Практические основы математической обработки результатов психолого-педагогического исследования
2.1. G – критерий знаков
Назначение
G – критерий знаков применяется при выяснении направления сдвига при переходе от первого измерения ко второму на одной и той же выборке испытуемых.
Ограничения
Количество измерений в каждом из двух замеров не менее 5 и не более 300, т.е. 5 ≤ n 1 ≤ 300 и 5 ≤ n 2 ≤ 300.
Алгоритм использования
1. Проверить выполнение ограничений;
2. Занести данные измерений в таблицу:
Испытуемые | 1 | 2 | 3 | n |
Значения «до воздействия» | ||||
Значения «после воздействия» | ||||
Сдвиг («после» - «до») |
Сдвиг количественно не подсчитывается, ставится просто, знак разности (« + » или « - »), когда из значения «после воздействия» вычитается значение «до воздействия». Если разность эта равна нулю, то в таблице пишут нуль.
3. Подсчитать количество нулевых реакций n 0 и вычесть их из объема выборки n. Новый объем выборки найти по формуле: n = n – n 0;
4. Определить, каких сдвигов больше: положительных или отрицательных. Считать «типичными» те сдвиги, которых больше. А «нетипичными» – те, которых меньше;
5. Сформулировать гипотезы:
Н0: Сдвиг в типичную сторону является случайным;
H1: Сдвиг в типичную сторону является неслучайным.
6. Подсчитать количество «нетипичных» сдвигов и найти эмпирическое значение G – критерия: G эмп. равно количеству «нетипичных» сдвигов;
|
|
7. По таблице 2 (см. Приложение) по значению n найти G кр. (p ≤ 0,05) и G кр. (p ≤ 0,01), изобразить все полученные значения на оси значимости.
зона значимости зона неопределенности зона не значимости
Если G эмп. ≤ G кр. на некотором уровне значимости, то H0 отвергается, а H1 принимается на этом уровне значимости.
Если G эмп. > G кр. на некотором уровне значимости, то H0 принимается на том же уровне значимости. Чем меньше G эмп., тем более вероятно, что сдвиг в типичном направлении статистически достоверен.
Замечание
На практике всегда желательно брать группу испытуемых больше пяти человек.
Пример 1. На одной и той же группе испытуемых произведены два замера некоторого признака - «до обучения» и «после обучения». Можно ли считать обучение эффективным, если результаты таковы:
Испытуемые | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
Значения «до» | 8 | 6 | 3 | 2 | 5 | 5 | 7 | 8 | 10 | 12 |
Значения «после» | 12 | 8 | 3 | 5 | 10 | 4 | 9 | 8 | 9 | 15 |
Решение
Оценки испытуемых в общей массе после воздействия возросли, то есть без исследования можно было бы сделать вывод об эффективности обучения.
Так как речь идет об одной группе испытуемых, то следует применить G – критерий знаков, действуя по алгоритму:
|
|
1. Проверим ограничения. Так как n = 10 и 5 < 10 < 300, то критерий применим.
2. Заполним таблицу вида:
Испытуемые | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
Значения «до» | 8 | 6 | 3 | 2 | 5 | 5 | 7 | 8 | 10 | 12 |
Значения «после» | 12 | 8 | 3 | 5 | 10 | 4 | 9 | 8 | 9 | 15 |
Сдвиг («после» - «до) | + | + | 0 | + | + | - | + | 0 | - | + |
3. Подсчитаем количество нулевых реакций и найдем новый объем выборки. Количество n 0 = 2, значит n = 10 - 2 = 8 – новый объем выборки;
4. Подсчитаем количество положительных и отрицательных сдвигов: сдвигов «+» – 6, сдвигов «-» – 2. Значит, «+» сдвиги – «типичные», а « - » сдвиги – «нетипичные»;
5. Сформулируем гипотезы:
H0: Сдвиг показателей в типичную сторону является случайным;
H1: Сдвиг показателей в типичную сторону является неслучайным.
6. Найдем G эмп., равное количеству «нетипичных сдвигов» – 2;
7. По таблице 2 (см. Приложение) для критерия знаков для n = 8 найдем G кр. (p ≤ 0,05) = 1 и G кр. (p ≤ 0,01) = 0.
Изобразим ось значимости:
зона значимости зона неопределенности зона не значимости
0 1 2
G кр. (p ≤ 0,01) G кр. (p ≤ 0,05) G эмп.
Так как G эмп. > G кp. (p ≤ 0,05), то принимается Н0, т. е. различия случайны.
Вывод: Обучение нельзя считать эффективным.
Пример 2
В эксперименте по непроизвольному запоминанию слов 12 испытуемых (А, Б, В ...) запомнили по разному слова, обозначающие профессии (слесарь, химик, электрик, физик, биолог, геолог, юрист, анатом, токарь, оператор) и обозначающие научные абстракции (гипотеза, суждение, аналогия, теорема, знание, вывод, закон, анализ, аксиома, синтез).
|
|
Значимы ли различия в эффективности запоминания этих категорий слов в данной группе испытуемых?
Объем запоминания | испытуемые | |||||||||||
А | Б | В | Г | Д | Е | Ж | З | И | К | Л | М | |
Профессии | 4 | 3 | 3 | 3 | 1 | 3 | 5 | 1 | 4 | 5 | 4 | 2 |
Научные абстракции | 1 | 4 | 2 | 2 | 2 | 4 | 1 | 4 | 2 | 2 | 0 | 1 |
1. Проверим ограничения. Так как n = 12 и 5 < 12 < 300, то критерий применим;
2. Составим таблицу:
Объем запоминания | испытуемые | |||||||||||
А | Б | В | Г | Д | Е | Ж | З | И | К | Л | М | |
Профессии | 4 | 3 | 3 | 3 | 1 | 3 | 5 | 1 | 4 | 5 | 4 | 2 |
Научные абстракции | 1 | 4 | 2 | 2 | 2 | 4 | 1 | 4 | 2 | 2 | 0 | 1 |
Знак разности | + | - | + | + | - | - | + | - | + | + | + | + |
3. Подсчитаем количество нулевых реакций: n 0 = 0, значит n = 12 - 0 = 12;
4. Подсчитаем количество «+» и (-) сдвигов: сдвигов «+ » – 8, сдвигов «-» – 4. Значит, «+» сдвиги – «типичные», а «-), – «нетипичные»;
5. Сформулируем гипотезы:
Н0: Сдвиг показателей в типичную сторону является случайным.
|
|
H1: Сдвиг показателей в типичную сторону является неслучайным.
6. Найдем G эмп., равное количеству «нетипичных» сдвигов – 4;
7. По таблице 2 Приложения для n = 12 найдем G кр. (p ≤ 0,05) = 2; G кр. (p ≤ 0,01) = 1
Изобразим ось значимости:
зона значимости зона неопределенности зона не значимости
1 2 4
G кр. (p ≤ 0,01) G кр. (p ≤ 0,05) G эмп.
Так как G эмп. > G кp. (p ≤ 0,05), то принимается Н0, т. е. различия случайны.
Вывод: Преобладание эффективности запоминания профессий по сравнению с эффективностью запоминания научных абстракций не является статистически значимым.
2.2. Т – критерий Вилкоксона
Назначение
Т – критерий Вилкоксона применяется для сопоставления показателей, измеренных на одной и той же выборке, и позволяет оценить не только направленность сдвигов, но и их интенсивность.
Ограничение
Объем выборки должен быть 5 ≤ n ≤ 50.
Алгоритм использования:
1. Проверить выполнение ограничений;
2. Поместить данные в таблицу, записав в первый столбец испытуемых в каком-то определенном порядке (или их коды), во второй – результаты первого замера, а в третий – результаты второго замера:
№ испытуемого | Замер 1 | Замер 2 | di = «после» - «до» | | di | | Ранг | di | | Ранг «не типичные» |
1 | 2 | 3 | 4 | 5 | 6 | 7 |
1 | Х1 | Y1 | . | . | . | . |
2 | Х2 | Y2 | . | . | . | . |
3 | Х3 | Y3 | . | . | . | . |
… | … | … | … | … | … | … |
n | Xi | Yi | . | . | . | . |
Суммы | - | - | - | - | Ri = ? | ∑Rнетип.=? |
3. Вычислить разность между значениями di = «после» - «до» для каждого испытуемого и занести в четвертый столбец. Нулевые сдвиги, если они получились, далее не рассматривать, уменьшить объем выборки на количество нулевых сдвигов n 0. Новый объем выборки n = n – n 0.
В пятый столбец записать модули разностей: |di|, затем проранжировать их, приписывая меньшему значению меньший ранг, а равным значениям – равные ранги. Результаты ранжирования записать в шестой столбец таблицы. Проверить совпадение суммы рангов с расчетной суммой по формуле
∑ Ri = n(n + 1) / 2;
4. Определить «типичные» и «нетипичные» сдвиги («типичные» – те, которых больше, «нетипичные» – те, которых меньше). Выписать ранги «нетипичных» сдвигов R нетип. в седьмой столбец таблицы и просуммировать их;
5. Сформулировать гипотезы.
H0: Интенсивность сдвигов в типичном направлении не превышает интенсивность сдвигов в нетипичном направлении.
Н1: Интенсивность сдвигов в типичном направлении превышает интенсивность сдвигов в нетипичном направлении.
6. Подсчитать эмпирическое значение критерия по формуле
Т эмп. = ∑ Rнетип.
7. По таблице 3 Приложения найти T кр. (p ≤ 0,05) и T кр. (p ≤ 0,01) при соответствующем n.
Построить ось значимости:
зона значимости зона неопределенности зона не значимости
Если Т эмп. > Т кр. (p ≤ 0,05), то принимается Н0.
Если Т эмп. ≤ Т кр. на некотором уровне значимости, то Н0 отвергается и принимается Н1 на этом уровне значимости.
Чем меньше Т эмп., тем более вероятно, что сдвиг в типичном направлении статистически достоверен.
Пример 1
На одной и той же группе испытуемых произведены два замера некоторого признака – «до обучения» и «после обучения». Можно ли считать обучение эффективным, если его результаты таковы:
Испытуемые | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
Значения «до» | 8 | 6 | 3 | 2 | 5 | 5 | 7 | 8 | 9 | 15 |
Значения «после» | 12 | 8 | 3 | 5 | 10 | 4 | 9 | 8 | 9 | 15 |
Решение
Используем для решения примера алгоритм Т – критерия:
1. Проверим выполнимость ограничений: 5 ≤ 10 ≤ 50;
2. Запишем данные в таблицу и сделаем необходимые вычисления:
№ испыт. | Замер 1 | Замер 2 | di = «после» - «до» | |di| | Ранг |di| | Ранг «нетип.» |
1 | 2 | 3 | 4 | 5 | 6 | 7 |
1 | 8 | 12 | 4 | 4 | 7 | - |
2 | 6 | 8 | 2 | 2 | 3,5 | - |
3 | 3 | 3 | 0 | 0 | - | - |
4 | 2 | 5 | 3 | 3 | 5,5 | - |
5 | 5 | 10 | 5 | 5 | 8 | - |
6 | 5 | 4 | -1 | 1 | 1,5 | 1,5 |
7 | 7 | 9 | 2 | 2 | 3,5 | - |
8 | 8 | 8 | 0 | 0 | - | - |
9 | 10 | 9 | -1 | 1 | 1,5 | 1,5 |
10 | 12 | 15 | 3 | 3 | 5,5 | - |
Суммы | - | - | - | - | 36 | 3 |
В пятом столбце получились числа 4; 2; 0; 3; 5; 1; 2; 0; 1; 3. Исключим нулевые сдвиги и подсчитаем новый объем выборки: n = 10 - 2 = 8;
2. Запишем модули сдвигов в ряд по возрастанию и укажем их места в этом ряду, а затем припишем соответствующие ранги:
|di| | Место | Ранг |
1 | 1 | 1,5 |
1 | 2 | 1,5 |
2 | 3 | 3,5 |
2 | 4 | 3,5 |
3 | 5 | 5,5 |
3 | 6 | 5,5 |
4 | 7 | 7 |
5 | 8 | 8 |
4. Определим, какие сдвиги являются «типичными», а какие – «нетипичными». Положительных сдвигов больше, их шесть, значит, они «типичные». Отрицательных – меньше, их всего два, значит, они «нетипичные»;
5. Сформулируем гипотезы:
Н0: интенсивность сдвига в типичном направлении не превосходит интенсивность сдвига в нетипичном направлении;
Н1: интенсивность сдвига в типичном направлении превосходит интенсивность сдвига в нетипичном направлении.
6. Подсчитаем Т эмп. = ∑ R нетип. = 1,5 + 1,5 = 3;
7. По числу n и таблице 3 Приложения найдем Т кр. (p ≤ 0,05) = 5 и Т кр. (p ≤ 0,01) = 1.
Построим ось значимости и отметим на ней все найденные значения:
зона значимости зона неопределенности зона не значимости
1 3 5
T кр. (p ≤ 0,01) Т эмп. T кр. (p ≤ 0,05)
Так как Т эмп. < Т кр. (p ≤ 0,05), то Н0 отвергается и принимается Н1, на уровне значимости p ≤ 0,05, то есть сдвиг в типичном направлении более интенсивен, чем сдвиг в нетипичном направлении, что мы можем утверждать с вероятностью, большей 95 %.
Вывод: Обучение можно считать эффективным (с вероятностью, большей 95 %).
С помощью Т – критерия мы выявили неслучайный сдвиг в положительном направлении при воздействии, то есть можно с вероятностью, большей 95%, сказать, что обучение эффективно, но с вероятностью, большей 99 %, этого утверждать нельзя, так как Т эмп. > Т кр. (p ≤ 0,01).
Пример 2
В эксперименте по непроизвольному запоминанию слов 12 испытуемых (А, Б, В ... ) запомнили по-разному слова, обозначающие профессии (слесарь, химик, электрик, физик, геолог, биолог, юрист, анатом, токарь, оператор) и обозначающие научные абстракции (гипотеза, суждение, аналогия, теорема, знание, вывод, закон, анализ, аксиома, синтез).
Объем запоминания | испытуемые | |||||||||||
А | Б | В | Г | Д | Е | Ж | З | И | К | Л | М | |
Профессии | 4 | 3 | 3 | 5 | 1 | 3 | 5 | 1 | 4 | 5 | 4 | 2 |
Научные абстракции | 1 | 4 | 2 | 2 | 2 | 4 | 1 | 4 | 2 | 2 | 0 | 1 |
Значимы ли различия в эффективности запоминания этих категорий слов в данной группе испытуемых?
Решение
1. Проверим выполнимость ограничений: 5 ≤ 12 ≤ 50;
2. Запишем данные в таблицу и сделаем необходимые вычисления:
Профессии | 4 | 3 | 3 | 5 | 1 | 3 | 5 | 1 | 4 | 5 | 4 | 2 |
Научные абстракции | 1 | 4 | 2 | 2 | 2 | 4 | 1 | 4 | 2 | 2 | 0 | 1 |
Разность | +3 | -1 | +1 | +3 | -1 | -1 | +4 | -3 | +2 | +3 | +4 | +1 |
Ранг разности по абсолютной величине | 8,5 | 3 | 3 | 8,5 | 3 | 3 | 11,5 | 8,5 | 6 | 8,5 | 11,5 | 3 |
3. Поясним, как записывается нижняя строка. Наименьшее значение разности (- 1), таких значений 5 (независимо от знака), суммируем их номера (1, 2, 3, 4, 5), находим среднее арифметическое (- 3), проставляем всем единицам один и тот же ранг З. Следующий ранг – 6 получает значение разности 2. На ранги 7, 8, 9, 10 претендуют четыре значения 3, их помечаем рангом 8,5. (7 + 8 + 9 + 10)/ 4 = 8,5
4. Определим, какие сдвиги являются «типичными», а какие «нетипичными». Положительных – больше, их 8, значит они – «типичные». Отрицательных – меньше, их всего 4, значит, они – «нетипичные»;
5. Сформулируем гипотезы:
Н0: интенсивность сдвига в типичном направлении не превосходит интенсивность сдвига в нетипичном направлении;
Н1: интенсивность сдвига в типичном направлении превосходит интенсивность сдвига в нетипичном направлении.
6. Подсчитаем Т эмп. = ∑R нетип. = 3 + 3 + 3 + 8,5 = 17,5;
7. По таблице 3 Приложения и n = 12 находим Т кр. (p ≤ 0,05) = 17, Т кр. (p ≤ 0,01) = 9;
Построим ось значимости и отметим на ней все найденные значения:
зона значимости зона неопределенности зона не значимости
9 17… 17,5
T кр. (p ≤ 0,01) T кр. (p ≤ 0,05)……………… Т эмп.
Так как Т эмп. > Т кр. (p ≤ 0,05) и тем более Т эмп. > Т кр. (p ≤ 0,01), следовательно, то Н1 отвергается и принимается Н0, на уровне значимости p ≤ 0,01.
Вывод: различия в величинах объема запоминания разных качеств слов не являются в данной группе испытуемых статистически значимыми.
2.4. Угловой критерий Фишера – φ *
Назначение
Угловой φ – критерий Фишера предназначен для сопоставления двух выборок по частоте встречаемости некоторого эффекта, заинтересовавшего исследователя. Особенно удобно его использовать при проверке «отсутствия – наличия эффекта» при сравнении контрольной и экспериментальной групп.
Ограничения
1. Если nA и nB – объемы выборок, то nA ≥ 5, nB ≥ 5. Допускаются также случаи: nA = 2, nB ≥ 30; nA = 3, nB ≥ 7; nA = 4, nB ≥ 5.
2. Ни одна из сопоставляемых долей в каждой выборке не должна быть равна нулю.
Алгоритм использования
1. Проверить выполнимость ограничений для nA и nB;
2. Определить значения признака, которые будут делить испытуемых на тех, у которых «есть эффект». И на тех, у которых «нет эффекта». Подсчитать количество таких испытуемых в группах А и В. Занести данные в таблицу
«Есть эффект» | «Нет эффекта» | Сумма | |
Группа А | А | B | A + B |
Группа В | С | D | C + D |
А + С | B + D | A + B + C + D |
Проверить совпадение контрольной суммы A + B + C + D = nA + nB;
3. Подсчитать процентные доли испытуемых, у которых «есть эффект», и тех, у кого «нет эффекта», в обеих выборках и занести в четырех клеточную таблицу:
«Есть эффект» (%) | «Нет эффекта» (%) | |
Группа А | M (%) | K (%) |
Группа В | P (%) | Q (%) |
Проверить, не равны ли некоторые процентные доли нулю. Если одна из долей равна нулю, то можно сдвинуть точку деления признака на две группы;
4. Сформулировать гипотезы:
Н0: доля испытуемых, у которых «есть эффект» в группе А, не выше доли испытуемых в группе В;
Н1: доля испытуемых, у которых «есть эффект» в группе А, выше доли испытуемых в группе В.
5. По таблице 4 Приложения найти величины углов φ 1 и φ 2 для процентной доли тех, у кого «есть эффект», в каждой выборке;
6. Подсчитать эмпирическое значение критерия по формуле
где n 1 и n 2 – количество наблюдений (измерений) в 1-й и 2-й выборках; φ 1 и φ 2 – значения угла, соответствующие процентным долям Р 1 и Р 2 для двух значений эффекта, которые находятся по формуле
где Р – процентная доля, выраженная в долях единицы (например, 60% = 0,6; 40% = 0,4 и т.п.).
7. По таблице 5 Приложения определить р – уровень значимости различий для полученных процентных долей.
Для контроля сравнить φ * эмп с φ * кр(p ≤ 0,05) = 1,64 и φ * кр (p ≤ 0,01) = 2,31.
Изобразить найденные значения на оси значимости:
зона значимости зона неопределенности зона не значимости
Если φ * эмп ≥ φ * крна некотором уровне значимости, то Н0 отвергается на этом уровне значимости. Если φ * эмп ≤ φ * кр (p ≤ 0,05), то принимается Н0.
Пример 1
Имеются две группы детей из параллельных средних групп детского сада, одна из них экспериментальная, другая – контрольная. В экспериментальной группе проводилась работа по развитию пространственных представлений по новой методике, в контрольной группе по обычной методике. После этого в обеих группах давалась задача на прохождение лабиринта. В экспериментальной группе из 20 человек с заданием справились 12, а в контрольной группе из 25 человек с заданием справились 10. Достоверно ли различаются результаты в этих группах?
Решение
1. Проверим выполнимость ограничений:
(n 1 = 20 > 5 и n 2 = 25 > 5);
2. Разделим группы детей на части с помощью признака «справился с заданием» и «не справился с заданием». Заполним таблицу:
«Есть эффект» | «Нет эффекта» | Сумма | |
Экспериментальная группа | 12 | 8 | 20 |
Контрольная группа | 10 | 15 | 25 |
22 | 23 | 45 |
Контрольные суммы совпадают:
A + B + C + D = 12 + 8 + 10 + 15 = 20 + 25 = n1 + n2;
3. Подсчитываем процентные доли количества детей, «справившихся с заданием» в экспериментальной и контрольной группах. В экспериментальной группе всего 20 человек, которые составляют 100 %, из них справились с заданием 12 человек, они составляют х %. Тогда
20 / 12 = 100 / х; x = 12∙100 % / 20 = 60 %;
Значит, не справились с заданием в экспериментальной группе
100 % - 60 % =40 %.
Аналогично, в контрольной группе 25 человек, которые составляют 100 %, из них справились с заданием 10 человек, которые составляют y %. Значит,
25 / 10 = 100 / y; y = 10 ∙ 100 % / 25 = 40 %;
Тогда доля, не справившихся с заданием в контрольной группе равна 60 %.
Заполним четырехклеточную таблицу:
«Есть эффект» | «Нет эффекта» | |
Экспериментальная группа | 60 % | 40 % |
Контрольная группа | 40 % | 60 % |
Отсюда видно, что ни одна из процентных долей не равна нулю.
4. Сформулируем гипотезы:
Н0: доля испытуемых в экспериментальной группе, у которых «есть эффект», не превосходит доли таких же испытуемых в контрольной группе;
Н1: доля испытуемых в экспериментальной группе, у которых «есть эффект», превосходит долю таких же испытуемых в контрольной группе.
5. По таблице 4 Приложения найти значения φ 1 и φ 2 по процентному содержанию тех испытуемых, у которых «есть эффект»:
φ 1 (60%) = 1,77; φ 2 (40%) = 1,37.
6. Подсчитаем
7. По таблице 5 Приложения найдем уровень значимости различия процентных долей: φ * эмп = 1,34 соответствует уровню значимости p = 0,09.
Для практики этот уровень мал, поэтому следует сравнить φ * эмп с φ * кр (p ≤ 0,05) = 1,64 и φ * кр (p ≤ 0,01) = 2,31 (их тоже найти по таблице 5).
Ось значимости имеет следующий вид:
зона значимости зона неопределенности зона не значимости
1,34 1,64 2,31
φ * эмп φ * кр (p ≤ 0,05) φ * кр (p = 0,01)
Так как φ * эмп < φ * кр (p ≤ 0,05), а тем более φ эмп. < φ * кр (p ≤ 0,01), то принимается Н0 с вероятностью ≥ 99 %.
Доля детей в экспериментальной группе, которые справились с заданием, не выше, чем доля таких детей в контрольной группе. Статистически такой процент различий недостаточен (хотя, на первый взгляд, разница в показателях у них большая – 20 %).
Вывод: Различия в результатах групп статистически незначимы.
Пример 2
В эксперименте по исследованию интермодального переноса получено, что в одной группе испытуемых (nА = 8) более эффективным оказалось тактильное ознакомление с последующим зрительным узнаванием (8 человек из 14), тогда как во второй группе (nВ = 10 чел.) только для трех испытуемых этот вид переноса был эффективнее, чем перенос в направлении зрение-осязание. Значимы ли различия этих двух групп испытуемых в части эффективности переноса осязание-зрение?
Решение
1. Проверим выполнимость ограничений
(nА = 14 > 5 и nB =10 > 5);
2. Разделим группы детей на части с помощью признака «справился с заданием» и «не справился с заданием». Заполним таблицу:
«Есть эффект» | «Нет эффекта» | Сумма | |
Группа А | 8 | 6 | 14 |
Группа В | 3 | 7 | 10 |
11 | 13 | 24 |
Контрольные суммы совпадают:
A + B + C + D = 8 + 6 + 3 + 7 = 14 + 10 = nA + nB;
3. Подсчитаем процентные доли количества детей, «справившихся с заданием» и «не справившихся с заданием) в группе А и группе В. В группе А всего 14 человек, которые составляют 100 %, из них справились с заданием 8 человек, они составляют х %. Тогда:
14 / 3 = 100 / x; x = 8 ∙ 100 % / 14 = 57 %.
Значит, не справились с заданием в экспериментальной группе
100% - 57 % = 43 %.
Аналогично, во второй группе 10 человек, которые составляют 100%, из них справились с заданием 3 человека, которые составляют у %. Значит:
10 / 3 = 100 / y; y = 3 ∙ 100 % / 10 = 30 %.
Тогда доля, не справившихся с заданием в контрольной группе равна 100 % - 30 % = 70 %. Заполним таблицу:
«Есть эффект» | «Нет эффекта» | |
Группа А | 57% | 43% |
Группа В | 30% | 70% |
Ни одна из процентных долей не равна нулю.
4. Сформулируем гипотезы:
Н0: доля испытуемых в группе А, у которых «есть эффект», превосходит доли таких же испытуемых в группе В;
Н1: доля испытуемых в группе А, у которых «есть эффект», не превосходит долю таких же испытуемых в группе В;
5. По таблице 4 Приложения найдем значения φ 1 и φ 2 по процентному содержанию тех испытуемых, у которых «есть эффект»:
φ 1 (57 %) = 1,71; φ 2 (30%) = 1,16.
6. Подсчитаем
7. По таблице 5 Приложения для уровня статистической значимости разных значений φ – критерия найдем уровень значимости различия процентных долей: φ * эмп = 1,33, соответствует уровню значимости p = 0,092.
Сравним φ * эмп с φ * кр (p ≤ 0,05) = 1,64 и φ * кр (p ≤ 0,01) = 2,31.
Ось значимости имеет следующий вид:
зона значимости зона неопределенности зона не значимости
1,33 1,64 2,31
φ * эмп φ * кр (p ≤ 0,05) φ * кр (p ≤ 0,01)
Так как φ * эмп < φ * кр (p ≤ 0,05) и тем более φ * эмп < φ * кр (p ≤ 0,0 1), то принимается Н0
Вывод: Различия в результатах групп статистически незначимы.
2.4. Q – критерий Розенбаума
Назначение
Q – критерий Розенбаума применяется для оценки различий между двумя независимыми выборками по уровню какого-либо признака или свойства, измеренного количественно.
Ограничения
В каждой выборке должно быть не менее 11 наблюдений, т.е. n 1 ≥ 11, n 2 ≥ 11,
n 1 ≈ n 2.
При этом:
если n 1 ≤ 50, n 2 ≤ 50, то (n 1 – n 2) ≤ 10;
если 51 ≤ n 1 ≤ 100, то (n 1 – n 2 ) ≤ 20;
если n 1 ≥ 100, n 2 ≥ 100, то n 1 / n 2 ≤ 1,5, где n 1 ≥ n 2.
Алгоритм использования
1. Проверить выполнение ограничений критерия:
(n 1 ≥ 11, n 2 ≥ 11, n 1 ≈ n 2)
2. Упорядочить значения признака в каждой выборке по убыванию. Определить в каждой выборке максимальное и минимальное значения исследуемого параметра. Считать первой ту выборку, в которой максимальное значение параметра больше, а второй – ту, в которой максимальное значение меньше.
3. Сформулировать гипотезы:
Н0: уровень признака в выборке 1 не превышает уровня признака в выборке 2;
Н1: уровень признака в выборке 1 превышает уровень признака в выборке 2;
4. Подсчитать количество значений (S 1) в выборке 1, которые больше максимального значения в выборке 2, и количество значений (S 2) в выборке 2, которые меньше минимального значения в выборке 1;
5. Найти эмпирическое значение Q – критерия Розенбаума по формуле
Q эмп. = S 1 + S 2;
6. По таблице 6 Приложения для данных n 1 и n 2 определить критические значения критерия с уровнями значимости p ≤ 0,05 и p ≤ 0,01. Сравнить Q эмп. и Q кр.
Если Q кр. ≥ Q кр. на некотором уровне значимости, то Н0 отклоняется на том уровне значимости, на котором вычислено критическое значение, а принимается Н1. Если Q эмп. < Q кр. (p ≤ 0,05), то принимается Н0.
Чем больше значения Q эмп., тем более достоверны различия.
Построить ось значимости:
зона значимости зона неопределенности зона не значимости
Q кр. (p ≤ 0,05) Q кр. (p ≤ 0,01)
Замечание
Q – критерий нежелательно применять тогда, когда максимальное и минимальное значения признака принадлежит одной группе. В этом случае погрешность очень велика.
Пример 1
У двух групп испытуемых (группа А и группа В) измерен по одной и той же методике уровень вербального интеллекта. Можно ли утверждать, что в первой группе оценки выше, чем во второй?
Оценки таковы:
группа А: 121; 104; 115; 116; 115; 109; 115; 109; 108; 112; 112;109.
группа В: 121; 113; 123; 124; 121; 121; 120; 121; 111; 116; 118; 125; 125; 125; 126.
Решение
Так как даны две независимые выборки испытуемых, у которых измерен один и тот же признак, то можно попытаться применить Q – критерий Розенбаума.
1. Проверим выполнимость ограничений:
nA = 12; nB = 15; (nA – nB) = (12 -15) == 3 < 10.
Ограничения выполнены.
2. Упорядочим значения признака по убыванию в каждой выборке и найдем максимальное и минимальное значения признака:
группа А: 121; 116; 115; 115; 115; 112; 112; 109; 109; 109; 108; 104;
группа В: 126; 125; 125; 125; 124; 123; 121; 121; 121;121; 120; 118; 116; 113; 111;
xmax (А) = 121; xmin (A) = 104; xmax (В) = 126; xmin (B) = 111;
Назовем выборкой 1 группу В, выборкой 2 – группу А;
3. Сформулируем гипотезы:
Н0: уровень вербального интеллекта в выборке 1 не выше уровня вербального интеллекта в выборке 2;
H1: уровень вербального интеллекта в выборке 1 выше уровня вербального интеллекта в выборке 2;
4. Подсчитаем S 1 – количество значений в выборке 1, которые больше max значения в выборке 2, S 1 = 6, так как шесть значений в выборке 1 больше xmax (2) = 121, а именно: 126, 125, 125, 125, 124, 123.
Так же для S 2 – количество значений в выборке 2, которые меньше минимального значения в выборке 1. S 2 = 5, так как в выборке 2 пять значений (109, 109, 109, 108 и 104), меньших xmin (1) = 111;
5. Найдем эмпирическое значение Q – критерия Розенбаума
Q эмп. = S 1 + S 2 = 6 + 5 = 11;
6. По таблице 6 Приложения найдем для n 1 = 12 и n 2 = 15 Q кр. (p ≤ 0,05) = 7 и Q кр. (p ≤ 0,01) = 9.
Изобразим ось значимости:
зона значимости зона неопределенности зона не значимости
7 9 11
Q кр. (p ≤ 0,05) Q кр. (p ≤ 0,01) Q эмп.
Так как Q эмп. > Q кр. (p ≤ 0,01) (и больше Q кр. (p ≤ 0,05)), то Н0 отвергается, Н1 принимается с уровнем значимости p ≤ 0,01, т.е. различия статистически значимы.
Вывод: Уровень вербального интеллекта испытуемых группы В выше уровня вербального интеллекта испытуемых группы А, причем различия статистически значимы, достоверность получаемых различий более 99 %.
Пример 2
У двух групп испытуемых (группа А и группа В) измерен показатель концентрации внимания:
группа А: 56, 40, 93, 89, 87, 93, 94, 88, 87, 71, 91, 58, 79, 69.
группа В: 74, 61, 74, 99, 75, 61, 74, 79, 70, 96, 45.
Можно ли утверждать, что в одной группе показатель выше, чем в другой?
Решение
Так как даны две независимые выборки испытуемых, у которых измерен один и тот же признак, то можно применить Q – критерий Розенбаума.
1. Проверим выполнимость ограничений:
n 1 = 14; n 2 = 11; (n 1 – n 2) = (14 -11) =3 < 10.
Ограничения выполнены.
2. Упорядочим значения признака по убыванию в каждой выборке и найдем максимальное и минимальное значения признака:
группа А: 94, 93, 93, 91, 89, 88, 87, 87, 79, 71, 69, 58, 56, 40;
группа В: 99, 96, 79, 75, 74, 74, 74, 70, 61, 61, 45;
xmax (А) = 94; xmin (А)= 40; xmax (В) = 99; xmin (B) = 45.
Назовем выборкой 1 группу В, выборкой 2 - группу А.
3. Сформулируем гипотезы:
Н0: показатель концентрации внимания в выборке 1 не выше показателя концентрации внимания в выборке 2;
Н1: показатель концентрации внимания в выборке 1 выше показателя концентрации внимания в выборке 2;
4. Подсчитаем S 1 – количество значений в выборке 1, которые больше max значения в выборке 2: S 1 = 2 (96 > 94 и 99 > 94). Аналогично подсчитаем S 2 – количество значений в выборке 2, которые меньше минимального значения в выборке 1: S 2 = 1 (40 < 45).
5. Найдем эмпирическое значение Q – критерий Розенбаума:
Q эмп. = S 1 + S 2 = 2 + 1 = 3;
6. По таблице 6 Приложения для n 1 = 14 и n 2 = 11 найдем Q кр. (p ≤ 0,05) = 7 и Q кр. (p ≤ 0,01) = 9.
Изобразим ось значимости:
зона значимости зона неопределенности зона не значимости
3 7 9
Q эмп. Q кр. (p ≤ 0,05) Q кр. (p ≤ 0,01)
Так как Q эмп. < Q кр. (p ≤ 0,05) и Q эмп. < Q кр. (p ≤ 0;01), то H1 отвергается и принимается Н0, т.е. различия статистически незначимы.
Вывод: Показатель концентрации внимания испытуемых группы В не выше показателя концентрации внимания в группе А.
2.6. U – критерий Манна-Уитни
Назначение
Предназначен для оценки различия величин членов двух выборок. Этот критерий основан на подсчете числа инверсий U (перестановок) членов в их общем упорядоченном ряду.
Ограничения
Объемы выборок должны удовлетворять условиям:
1) n 1 ≥ 3, n 2 ≥ 3, но допускается случай n 1 = 2, n 2 ≥ 5;
2) n 1 ≤ 60, n 2 ≤ 60, но на практике, если n 1 ≥ 20 и n 2 ≥ 20, то применение критерия затруднительно.
При больших объемах выборок лучше использовать другие критерии.
Алгоритм использования
1. Проверить ограничения критерия;
2. Объединить выборки А и В в одну общую выборку A U B, пометив принадлежность каждого индивидуального значения к данной группе (цветом, буквой, шифром). Упорядочить значения признака в объединенной выборке по возрастанию и проранжировать все значения, приписывая меньшему значению меньший ранг, а равным значениям – равный ранг;
3. Разделить выборку на две прежние выборки А и В, ориентируясь на пометки. Подсчитать суммы рангов отдельно для каждой из выборок, обозначить их за Та и Тв. Считать первой ту выборку, в которой значение по предварительной оценке выше, а второй – ту, в которой значения ниже. Пусть nА – объем выборки А, а nB – объем выборки В. Если ранжирование и подсчет произведены верно, то должно выполняться контрольное равенство
Та + Тв = (nА + nB) (nА + nB + 1) / 2.
Результаты занести в таблицу:
Значения A U B | х 1 | х 2 | х 3 | … | х n | Суммы |
Место | 1 | 2 | 3 | N | … | |
Ранг | r 1 | r 2 | r 3 | … | r n | … |
Выборка | … | … | ||||
Ранги А | … | Та = ? | ||||
Ранги В | … | Тв = ? |
Здесь N = nА + nB – объем объединенной выборки.
4. Сформулировать гипотезы:
Н0: уровень признака в выборке 1 не выше уровня признака в выборке 2;
Н1: уровень признака в выборке 1 выше уровня признака в выборке 2;
5. Вычислить значения U – критерия для каждой из выборок:
Найти U эмп., равное наименьшему из величин Uа и Uв:
U эмп. = min (Ua; Ub);
6. По таблице 7 Приложения по данным n 1 и n 2 найти U кр. (p ≤ 0,05) и U кр (p ≤ 0,01). Изобразить на оси значимости все найденные значения критерия.
Если U эмп. ≤ U кр. на некотором уровне значимости, то H0 отвергается, а H1 принимается на этом уровне значимости;
Если U эмп. > U кр. на некотором уровне значимости, то Н0 принимается на том же уровне значимости;
Чем меньше U эмпирический, тем более вероятно, что сдвиг в типичном направлении статистически достоверен.
Пример 1
Даны результаты тестирования двух групп испытуемых А и В по некоторому признаку или свойству:
группа А: 25; 14; 18; 16; 23; 22; 18; 19; nА = 8
группа В: 28; 15; 26; 13; 15; 11; 20; 19; 10; 12; nВ = 10
Можно ли считать, что результаты тестирования в группе В выше, чем в группе А?
Решение
1. Проверим ограничения критерия nА = 8, 8 > 3 и nB = 10, 10 > 3;
2. Объединим значения признака в одну общую выборку, приписывая меньшему значению меньший ранг и равным значениям – равные ранги;
3. Полученные данные занесем в таблицу
Значение | Место | Ранг | Выборка | Ta | Tв |
10 | 1 | 1 | В | - | 1 |
11 | 2 | 2 | В | - | 2 |
12 | 3 | 3 | В | - | 3 |
13 | 4 | 4 | В | - | 4 |
14 | 5 | 5 | А | 5 | - |
15 | 6 | 6,5 | В | - | 6,5 |
15 | 7 | 6,5 | В | - | 6,5 |
16 | 8 | 8 | А | 8 | - |
18 | 9 | 9,5 | А | 9,5 | - |
18 | 10 | 9,5 | А | 9,5 | - |
19 | 11 | 11,5 | А | 11,5 | - |
19 | 12 | 11,5 | В | - | 11,5 |
20 | 13 | 13 | В | - | 13 |
22 | 14 | 14 | А | 14 | - |
23 | 15 | 15 | А | 15 | - |
25 | 16 | 16 | А | 16 | - |
26 | 17 | 17 | В | - | 17 |
28 | 18 | 18 | В | - | 18 |
Сумма | 88,5 | 82,5 |
Подсчитаем сумму рангов в выборке А и в выборке В: Ta = 88,5; Tв = 82,5.
Проверим общую расчетную сумму:
(nА + nB) (nА + nB + 1) / 2 = (8 + 10) (8 + 10 + 1) / 2 = 171;
Та + Тв = 88,5 + 82,5 = 171.
Будем считать выборкой 1 группу В, а выборкой 2 – группу А;
4. Сформулируем гипотезы:
Н0: результаты тестирования в выборке 1 не выше результатов в выборке 2;
Н1: результаты тестирования в выборке 1 выше результатов в выборке 2;
5. Вычислим значения Ua и Uв:
Найдем U эмп. = min (Ua; Uв) = 27,5;
6. По таблице 6 Приложения по данным n 1 = 8 и n 2 = 10 найдем
U кр (p ≤ 0,05) и U кр. (p ≤ 0,01).
Изобразим на оси значимости все найденные значения критерия.
зона значимости зона неопределенности зона не значимости
13 20 27,5
U кр. (p ≤ 0,01) U кр. (p ≤ 0,05) U эмп.
Так как U эмп. > U кр. (p ≤ 0,05) и U эмп. > U кр. (p ≤ 0,01), то H0 принимается с уровнем значимости p ≤ 0,01, а H1 отвергается.
Значит, результаты тестирования в выборке 1 не выше, чем в выборке 2.
Различия между результатами в выборках статистически не достоверны, то есть случайны.
Вывод: Между результатами групп А и В существенных различий нет.
Если даны три и более выборок, на которых измерен один и тот же признак, то можно сравнить результаты попарно, пользуясь вышеизложенными критериями, или использовать специальные критерии (Крускала Уоллиса или Джонкира).
Пример 2
При измерении пространственных порогов тактильной чувствительности (ощущение прикосновения, давления и вибрации) получены следующие величины порогов для женщин и мужчин:
группа А (женщины) – 32, 30, 28, 30, 33, 37, 28, 27 (nА = 8);
группа В (мужчины) – 39, 36, 31, 35, 29, 34, 38 (nB = 7).
Отличаются ли между собой по величине пороги женщин и мужчин?
Решение
1.Проверим ограничения критерия nА= 8, 8 > 3 и nB = 7, 7 > 3 ;
2. Объединим значения признака в одну общую выборку, упорядочив ее по возрастанию, получим:
27, 28, 28, 29, 30, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39 (n = 15);
3. Проранжируем объединенную выборку, приписывая меньшему значению меньший ранг и равным значениям – равные ранги. Полученные данные занесем в таблицу:
Значение | Место | Ранг | Bыборка | Ta | Tв |
27 | 1 | 1 | А | 1 | - |
28 | 2 | 2,5 | А | 2,5 | - |
28 | 3 | 2,5 | А | 2,5 | - |
29 | 4 | 4 | В | - | 4 |
30 | 5 | 5,5 | А | 5,5 | - |
30 | 6 | 5,5 | А | 5,5 | - |
31 | 7 | 7 | В | - | 7 |
32 | 8 | 8 | А | 8 | - |
33 | 9 | 9 | А | 9 | - |
34 | 10 | 10 | В | - | 10 |
35 | 11 | 11 | В | - | 11 |
36 | 12 | 12 | В | - | 12 |
37 | 13 | 13 | А | 13 | - |
38 | 14 | 14 | В | - | 14 |
39 | 15 | 15 | В | - | 15 |
Сумма | 47 | 73 |
Подсчитаем сумму рангов в выборке А и в выборке В:
Та = 47, Тв = 73.
Проверим общую расчетную сумму:
(nА + nB) (nА + nB + 1) / 2 = (8 + 7) (8 + 7 + 1) / 2 = 120;
Та + Тв = 120.
Будем считать выборкой 1 группу В, а выборкой 2 – группу А;
4. Сформулируем гипотезы:
Н0: результаты измерения в выборке 1 не выше результатов в выборке 2;
Н1: результаты измерения в выборке 1 выше результатов в выборке 2.
5. Вычислим значения Ua и Uв:
По таблице 6 Приложения по n 1 = 7 и n 2 = 8 найдем U кр. (p ≤ 0,05) = 13 и
U кр. (p ≤ 0,01) = 7.
Изобразим на оси значимости все найденные значения критерия.
зона значимости зона неопределенности зона не значимости
7 11 13
U кр. (p ≤ 0,01) U эмп. U кр. (p ≤ 0,05)
Вывод: Так как U кр. (p ≤ 0,05) > U эмп. > U кр. (p ≤ 0,01), то можно считать различия величин порогов мужчин и женщин статистически значимыми (p ≤ 0,05).
Дата добавления: 2018-09-22; просмотров: 1048; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!