Сравнение уровня признака в независимых выборках



Сравнение уровня признака в двух независимых выборках можно выполнить с помощью t-критерия Стьюдента (параметрический метод), либо с помощью критерия Манна-Уитни (непараметрический метод).

По t-критерию Стьюдента производится сравнение средних арифметических значений, то есть уровня признака, в двух независимых выборках с равной дисперсией и распределением случайной величины, соответствующим нормальному типу. Порядок проверки распределений на соответствие нормальному рассмотрен выше. Равенство дисперсий проверяется по F-критерию Фишера:

                                                   F=s12/s22                                                                   

За s12 принимается большее из двух значений дисперсии, поэтому значение Fэмп. всегда больше 1. Полученное значение Fэмп сравнивается с критическим (Таблица 4 Приложения). При пользовании таблицей 4 число степеней свободы определяется по формулам n1=n1-1; n2=n2-1; критическое значение берется из клетки, находящейся на пересечении соответствующих строки и столбца. Если эмпирическое значение меньше критического, то различие дисперсий признается статистически незначимым.

Используется следующая формула t-критерия (здесь и ниже приводятся формулы критериев для малых выборок, то есть выборок с числом испытуемых менее 30):

где nx и ny - количество испытуемых в 1 и 2 выборках, Мх и Му - средние арифметические значения, sх и sу - стандартные отклонения соответственно в первой и второй выборках. Число степеней свободы n = nx+ ny - 2.

Критическое значение tкр определяется по таблицам (Таблица 5 Приложения). Если t эмп³ t кр, то принимается альтернативная гипотеза.

В программе Microsoft Excel расчет эмпирического значения критерия Стьюдента выполняется с использованием встроенного “Двухвыборочного t-теста с одинаковыми дисперсиями”. Для того чтобы воспользоваться встроенной функцией Microsoft Excel надо войти в раздел “Анализ данных” из меню “Сервис”, где выбрать “Двухвыборочный t-тест с одинаковыми дисперсиями”. На экране высвечивается меню “Двухвыборочного t-теста с одинаковыми дисперсиями”, в котором задаются интервалы обеих переменных, вероятность ошибки первого рода Альфа и выходной интервал (номер левой верхней ячейки выходного интервала). Входной интервал переменной задается через двоеточие, например интервал “a1:a24” включает в себя 24 значения переменной в столбце A с 1 по 24 ячейку. Если в первой строке интервала находится заголовок столбца (строки), то это следует указать в специальной ячейке меню. Гипотетическая средняя разность равна нулю по умолчанию. Выходные данные включают средние арифметические значения переменных в выборках, значения дисперсии, количество наблюдений в выборках, величину объединенной дисперсии, число степеней свободы, эмпирическое значение t-критерия и критические значения для одностороннего и двустороннего критериев.

 

Задача: В одной из школ Ленинградской области ученики 10 и 11 класса выполнили задания ШТУР (Школьный тест умственного развития)[AE1] . Различаются ли ученики 10 и 11 класса по уровню общей осведомленности?

Н0: показатели осведомленности учеников 10 и 11 класса значимо не различаются.

Н1: показатели осведомленности учеников 10 и 11 класса различаются значимо.

 

Таблица 10.

Сравнение показателей осведомленности по ШТУР учеников 10 и 11 классов одной из школ Ленинградской области (по t-критерию Стьюдента).

Результат ШТУР z-оценка испытуемого fэмп. по интервалам z

Результат ШТУР

z-оценка испытуемого fэмп. по интервалам z
20 1,369194  

20

1,632993  
20 1,369194  

18

1,020621  
19 1,039268  

18

1,020621 3
19 1,039268 4

17

0,714435  
18 0,709341  

17

0,714435  
18 0,709341  

16

0,408248  
18 0,709341  

16

0,408248 4
18 0,709341  

15

0,102062  
17 0,379415  

15

0,102062  
17 0,379415 6

14

-0,20412 3
16 0,049489 1

13

-0,51031 1
15 -0,28044  

11

-1,12268  
14 -0,61036  

11

-1,12268  
14 -0,61036  

10

-1,42887  
14 -0,61036  

9

-1,73506 4
14 -0,61036 5

 

   
13 -0,94029  

 

   
13 -0,94029  

 

   
10 -1,93007  

 

   
10 -1,93007 4

 

   

Среднее арифметическое Мх=15.85

Дисперсия s2=9,19

Стандартное отклонение s =3,031

Среднее арифметическое Мх=14,67

Дисперсия s2=10,67

Стандартное отклонение s =3,266

Проверка распределений результатов ШТУР на соответствие нормальному распределению:

c2эмпир.= (4-4.00)2 + (6-4.00)2 +

                  4.00      4.00

(1-4.00)2 + (5-4.00)2 + (4-4.00)2 = 3.50

4.00       4.00     4.00

c2эмпир.(3.50) < c2кр.(5.99), следовательно, распределение не отличается значимо от нормального (a=0.05), и к нему могут быть применены параметрические критерии.

c2эмпир.= (3-3.00)2 + (4-3.00)2 +

                  3.00      3.00

(3-3.00)2 + (1-3.00)2 + (4-3.00)2 = 2.00

3.00       3.00     3.00

c2эмпир.(2.00) < c2кр.(5.99), следовательно, распределение не отличается значимо от нормального (a=0.05), и к нему могут быть применены параметрические критерии.

Проверка равенства дисперсий: Fэмп=10.67/9.19=1.161.    Fкр.=2.32 при a=0.05

Fэмп<Fкр. Þ может быть использован критерий Стьюдента для двух выборок с равными дисперсиями.

 

 

= 1.106   n=33 tкр.= 2.03 (a=0.05)

 

 

t эмп. < t кр. Þ принимается нулевая гипотеза Н0.

Ответ: уровень осведомленности учеников 11 класса не отличается значимо от такового у учеников 10 класса (a=0.05).

             

 

    Применение критерия Стьюдента связано с целым рядом ограничений - соответствие обоих распределений нормальному типу, равенство дисперсий распределений, достаточные объемы выборок. Если для решения поставленной задачи использовать параметрический критерий Стьюдента нельзя, то следует воспользоваться его непараметрическим аналогом - критерием Манна-Уитни. Для применения непараметрического критерия Манна-Уитни требуется лишь, чтобы оба распределения относились к сходному, а не обязательно к нормальному типу, кроме того, признак может быть измерен не только в шкале отношений или интервалов, но и в шкале рангов.

Что особенно ценно, критерий Манна-Уитни применим при малых количествах наблюдений в выборках: в каждой выборке должно быть не менее 3 наблюдений. Допускается также, чтобы в одной из выборок было 2 наблюдения, но при этом в другой их должно быть не менее 5. Максимальное число наблюдений в выборках 60, для большего числа наблюдений нет таблиц критических значений. Но уже когда число наблюдений свыше 20 в каждой выборке, расчет критерия становится достаточно трудоемким для расчетов на калькуляторе.

Порядок действий при расчете эмпирического значения критерия следующий:

1. Проранжировать все измерения, объединив результаты двух выборок. Правила ранжирования следующие:

n Наименьшему значению из всех присваивается ранг 1, наибольшему - n1+n2.  

n Если два или большее количество значений равны, то для них рассчитывается средний ранг. Например, если три наименьших значения в выборке равны, то их средний ранг будет (1+2+3)/3=2. А если равны 10 и 11 значения, то их средний ранг (10+11)/2=10.5.

2. Подсчитать сумму рангов отдельно для первой (SR1) и для второй (SR2) выборки. Проверить, совпадает ли общая сумма рангов с расчетной по формуле SR1+SR2=N(N+1)/2, где N= n1+n2 - общее число ранжируемых значений.

3. Рассчитать эмпирические значения критерия Манна-Уитни для выборок:

   U1= n1.n2+ n1 (n1+1)/2 - SR1       U2 = n1.n2 + n2(n2+1)/2 - SR2

4. Проверить правильность расчета с помощью выражения U1+U2= n1.n2.

5. Эмпирическим значением является меньшее из двух рассчитанных значений. Оно сопоставляется с критическими значениями, приведенными в таблице 6 Приложения). Приложения для a=0.05 и a=0.01. Чем меньше значение U, тем выше достоверность различий, а значит, если Uэмп³Uкрит, то принимается нулевая гипотеза Н0, если Uэмп<Uкрит, то принимается альтернативная гипотеза.

 

Задача: В одной из школ Ленинградской области ученики 10 и 11 класса выполнили задания ШТУР (Школьный тест умственного развития). Различаются ли ученики 10 и 11 класса по способности классификации?

Н0: способности классификации учеников 10 и 11 класса значимо не различается.

Н1: показатели способности классификации учеников 10 и 11 класса различаются значимо.                                                                          

                                                                         Таблица 11

Сравнение способности классификации

по результатам ШТУР у юношей - учеников

10 и 11 классов (по критерию Манна-Уитни)

Исходные данные

Ранжирование переменных

11 класс 10 класс 10 класс Ранг 11 класс Ранг

23 20 6 1    

23 21 7 2    

20 20 10 4    

23 14 10 4    

23 14 10 4    

20 20 11 6    

22 11     12 7,5

21 17     12 7,5

19 14     13 9

16 15 14 12    

15 10 14 12    

14 6 14 12    

17 7     14 12

21 10     14 12

16 10 15 15,5    

14       15 15,5

13       16 18

12       16 18

12       16 18

16       17 20,5

    17 20,5    

Ме=18 Ме=14     19 22

q=3.5 q=4 20 25    

    20 25    

    20 25    

        20 25

        20 25

    21 29    

        21 29

        21 29

        22 31

        23 33,5

        23 33,5

        23 33,5

        23 33,5

    Сумма 197   433

 

Проверка: Общая сумма рангов 197+433=630.

N(N+1)/2=35х36.3=630, т.е. ранжирование выполнено верно.

U1=20х15+15x16/2-197=223

U2=20x15+20х21/2-433=77

Проверка: U1+U2=300. n1× n2=300


Дата добавления: 2018-05-12; просмотров: 513; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!