Сравнение уровня признака в независимых выборках
Сравнение уровня признака в двух независимых выборках можно выполнить с помощью t-критерия Стьюдента (параметрический метод), либо с помощью критерия Манна-Уитни (непараметрический метод).
По t-критерию Стьюдента производится сравнение средних арифметических значений, то есть уровня признака, в двух независимых выборках с равной дисперсией и распределением случайной величины, соответствующим нормальному типу. Порядок проверки распределений на соответствие нормальному рассмотрен выше. Равенство дисперсий проверяется по F-критерию Фишера:
F=s12/s22
За s12 принимается большее из двух значений дисперсии, поэтому значение Fэмп. всегда больше 1. Полученное значение Fэмп сравнивается с критическим (Таблица 4 Приложения). При пользовании таблицей 4 число степеней свободы определяется по формулам n1=n1-1; n2=n2-1; критическое значение берется из клетки, находящейся на пересечении соответствующих строки и столбца. Если эмпирическое значение меньше критического, то различие дисперсий признается статистически незначимым.
Используется следующая формула t-критерия (здесь и ниже приводятся формулы критериев для малых выборок, то есть выборок с числом испытуемых менее 30):
где nx и ny - количество испытуемых в 1 и 2 выборках, Мх и Му - средние арифметические значения, sх и sу - стандартные отклонения соответственно в первой и второй выборках. Число степеней свободы n = nx+ ny - 2.
|
|
Критическое значение tкр определяется по таблицам (Таблица 5 Приложения). Если t эмп³ t кр, то принимается альтернативная гипотеза.
В программе Microsoft Excel расчет эмпирического значения критерия Стьюдента выполняется с использованием встроенного “Двухвыборочного t-теста с одинаковыми дисперсиями”. Для того чтобы воспользоваться встроенной функцией Microsoft Excel надо войти в раздел “Анализ данных” из меню “Сервис”, где выбрать “Двухвыборочный t-тест с одинаковыми дисперсиями”. На экране высвечивается меню “Двухвыборочного t-теста с одинаковыми дисперсиями”, в котором задаются интервалы обеих переменных, вероятность ошибки первого рода Альфа и выходной интервал (номер левой верхней ячейки выходного интервала). Входной интервал переменной задается через двоеточие, например интервал “a1:a24” включает в себя 24 значения переменной в столбце A с 1 по 24 ячейку. Если в первой строке интервала находится заголовок столбца (строки), то это следует указать в специальной ячейке меню. Гипотетическая средняя разность равна нулю по умолчанию. Выходные данные включают средние арифметические значения переменных в выборках, значения дисперсии, количество наблюдений в выборках, величину объединенной дисперсии, число степеней свободы, эмпирическое значение t-критерия и критические значения для одностороннего и двустороннего критериев.
|
|
Задача: В одной из школ Ленинградской области ученики 10 и 11 класса выполнили задания ШТУР (Школьный тест умственного развития)[AE1] . Различаются ли ученики 10 и 11 класса по уровню общей осведомленности?
Н0: показатели осведомленности учеников 10 и 11 класса значимо не различаются.
Н1: показатели осведомленности учеников 10 и 11 класса различаются значимо.
Таблица 10.
Сравнение показателей осведомленности по ШТУР учеников 10 и 11 классов одной из школ Ленинградской области (по t-критерию Стьюдента). | ||||||||
Результат ШТУР | z-оценка испытуемого | fэмп. по интервалам z | Результат ШТУР | z-оценка испытуемого | fэмп. по интервалам z | |||
20 | 1,369194 | 20 | 1,632993 | |||||
20 | 1,369194 | 18 | 1,020621 | |||||
19 | 1,039268 | 18 | 1,020621 | 3 | ||||
19 | 1,039268 | 4 | 17 | 0,714435 | ||||
18 | 0,709341 | 17 | 0,714435 | |||||
18 | 0,709341 | 16
| 0,408248 | |||||
18 | 0,709341 | 16 | 0,408248 | 4 | ||||
18 | 0,709341 | 15 | 0,102062 | |||||
17 | 0,379415 | 15 | 0,102062 | |||||
17 | 0,379415 | 6 | 14 | -0,20412 | 3 | |||
16 | 0,049489 | 1 | 13 | -0,51031 | 1 | |||
15 | -0,28044 | 11 | -1,12268 | |||||
14 | -0,61036 | 11 | -1,12268 | |||||
14 | -0,61036 | 10 | -1,42887 | |||||
14 | -0,61036 | 9 | -1,73506 | 4 | ||||
14 | -0,61036 | 5 |
| |||||
13 | -0,94029 |
| ||||||
13 | -0,94029 |
| ||||||
10 | -1,93007 |
| ||||||
10 | -1,93007 | 4 |
| |||||
Среднее арифметическое Мх=15.85 Дисперсия s2=9,19 Стандартное отклонение s =3,031 | Среднее арифметическое Мх=14,67 Дисперсия s2=10,67 Стандартное отклонение s =3,266 | |||||||
Проверка распределений результатов ШТУР на соответствие нормальному распределению: | ||||||||
c2эмпир.= (4-4.00)2 + (6-4.00)2 + 4.00 4.00 (1-4.00)2 + (5-4.00)2 + (4-4.00)2 = 3.50 4.00 4.00 4.00 c2эмпир.(3.50) < c2кр.(5.99), следовательно, распределение не отличается значимо от нормального (a=0.05), и к нему могут быть применены параметрические критерии. | c2эмпир.= (3-3.00)2 + (4-3.00)2 +
3.00 3.00 (3-3.00)2 + (1-3.00)2 + (4-3.00)2 = 2.00 3.00 3.00 3.00 c2эмпир.(2.00) < c2кр.(5.99), следовательно, распределение не отличается значимо от нормального (a=0.05), и к нему могут быть применены параметрические критерии. | |||||||
Проверка равенства дисперсий: Fэмп=10.67/9.19=1.161. Fкр.=2.32 при a=0.05 Fэмп<Fкр. Þ может быть использован критерий Стьюдента для двух выборок с равными дисперсиями. | ||||||||
= 1.106 n=33 tкр.= 2.03 (a=0.05)
| ||||||||
t эмп. < t кр. Þ принимается нулевая гипотеза Н0. Ответ: уровень осведомленности учеников 11 класса не отличается значимо от такового у учеников 10 класса (a=0.05). | ||||||||
Применение критерия Стьюдента связано с целым рядом ограничений - соответствие обоих распределений нормальному типу, равенство дисперсий распределений, достаточные объемы выборок. Если для решения поставленной задачи использовать параметрический критерий Стьюдента нельзя, то следует воспользоваться его непараметрическим аналогом - критерием Манна-Уитни. Для применения непараметрического критерия Манна-Уитни требуется лишь, чтобы оба распределения относились к сходному, а не обязательно к нормальному типу, кроме того, признак может быть измерен не только в шкале отношений или интервалов, но и в шкале рангов.
Что особенно ценно, критерий Манна-Уитни применим при малых количествах наблюдений в выборках: в каждой выборке должно быть не менее 3 наблюдений. Допускается также, чтобы в одной из выборок было 2 наблюдения, но при этом в другой их должно быть не менее 5. Максимальное число наблюдений в выборках 60, для большего числа наблюдений нет таблиц критических значений. Но уже когда число наблюдений свыше 20 в каждой выборке, расчет критерия становится достаточно трудоемким для расчетов на калькуляторе.
Порядок действий при расчете эмпирического значения критерия следующий:
1. Проранжировать все измерения, объединив результаты двух выборок. Правила ранжирования следующие:
n Наименьшему значению из всех присваивается ранг 1, наибольшему - n1+n2.
n Если два или большее количество значений равны, то для них рассчитывается средний ранг. Например, если три наименьших значения в выборке равны, то их средний ранг будет (1+2+3)/3=2. А если равны 10 и 11 значения, то их средний ранг (10+11)/2=10.5.
2. Подсчитать сумму рангов отдельно для первой (SR1) и для второй (SR2) выборки. Проверить, совпадает ли общая сумма рангов с расчетной по формуле SR1+SR2=N(N+1)/2, где N= n1+n2 - общее число ранжируемых значений.
3. Рассчитать эмпирические значения критерия Манна-Уитни для выборок:
U1= n1.n2+ n1 (n1+1)/2 - SR1 U2 = n1.n2 + n2(n2+1)/2 - SR2
4. Проверить правильность расчета с помощью выражения U1+U2= n1.n2.
5. Эмпирическим значением является меньшее из двух рассчитанных значений. Оно сопоставляется с критическими значениями, приведенными в таблице 6 Приложения). Приложения для a=0.05 и a=0.01. Чем меньше значение U, тем выше достоверность различий, а значит, если Uэмп³Uкрит, то принимается нулевая гипотеза Н0, если Uэмп<Uкрит, то принимается альтернативная гипотеза.
Задача: В одной из школ Ленинградской области ученики 10 и 11 класса выполнили задания ШТУР (Школьный тест умственного развития). Различаются ли ученики 10 и 11 класса по способности классификации?
Н0: способности классификации учеников 10 и 11 класса значимо не различается.
Н1: показатели способности классификации учеников 10 и 11 класса различаются значимо.
Таблица 11
Сравнение способности классификации по результатам ШТУР у юношей - учеников 10 и 11 классов (по критерию Манна-Уитни) | ||||||||
Исходные данные | Ранжирование переменных | |||||||
11 класс | 10 класс | 10 класс | Ранг | 11 класс | Ранг | |||
23 | 20 | 6 | 1 | |||||
23 | 21 | 7 | 2 | |||||
20 | 20 | 10 | 4 | |||||
23 | 14 | 10 | 4 | |||||
23 | 14 | 10 | 4 | |||||
20 | 20 | 11 | 6 | |||||
22 | 11 | 12 | 7,5 | |||||
21 | 17 | 12 | 7,5 | |||||
19 | 14 | 13 | 9 | |||||
16 | 15 | 14 | 12 | |||||
15 | 10 | 14 | 12 | |||||
14 | 6 | 14 | 12 | |||||
17 | 7 | 14 | 12 | |||||
21 | 10 | 14 | 12 | |||||
16 | 10 | 15 | 15,5 | |||||
14 | 15 | 15,5 | ||||||
13 | 16 | 18 | ||||||
12 | 16 | 18 | ||||||
12 | 16 | 18 | ||||||
16 | 17 | 20,5 | ||||||
17 | 20,5 | |||||||
Ме=18 | Ме=14 | 19 | 22 | |||||
q=3.5 | q=4 | 20 | 25 | |||||
20 | 25 | |||||||
20 | 25 | |||||||
20 | 25 | |||||||
20 | 25 | |||||||
21 | 29 | |||||||
21 | 29 | |||||||
21 | 29 | |||||||
22 | 31 | |||||||
23 | 33,5 | |||||||
23 | 33,5 | |||||||
23 | 33,5 | |||||||
23 | 33,5 | |||||||
Сумма | 197 | 433 | ||||||
Проверка: Общая сумма рангов 197+433=630. N(N+1)/2=35х36.3=630, т.е. ранжирование выполнено верно. U1=20х15+15x16/2-197=223 U2=20x15+20х21/2-433=77 Проверка: U1+U2=300. n1× n2=300
Мы поможем в написании ваших работ! |