История разработки U-критерия



Данный метод выявления различий между выборками был предложен в 1945 году американским химиком и статистиком Фрэнком Уилкоксоном.
В 1947 году он был существенно переработан и расширен математиками Х.Б. Манном(H.B. Mann) и Д.Р. Уитни(D.R. Whitney), по именам которых сегодня обычно и называется.

Для чего используется U-критерий Манна-Уитни?

U-критерий Манна-Уитни используется для оценки различий между двумя независимыми выборками по уровню какого-либо количественного признака.

В каких случаях можно использовать U-критерий Манна-Уитни?

U-критерий Манна-Уитни является непараметрическим критерием, поэтому, в отличие от t-критерия Стьюдента, не требует наличия нормального распределения сравниваемых совокупностей.

U-критерий подходит для сравнения малых выборок: в каждой из выборок должно быть не менее 3 значений признака. Допускается, чтобы в одной выборке было 2 значения, но во второй тогда должно быть не менее пяти.

Условием для применения U-критерия Манна-Уитни является отсутствие в сравниваемых группах совпадающих значений признака (все числа – разные) или очень малое число таких совпадений.

Аналогом U-критерия Манна-Уитни для сравнения более двух групп является Критерий Краскела-Уоллиса.

Как рассчитать U-критерий Манна-Уитни?

Сначала из обеих сравниваемых выборок составляется единый ранжированный ряд, путем расставления единиц наблюдения по степени возрастания признака и присвоения меньшему значению меньшего ранга. В случае равных значений признака у нескольких единиц каждой из них присваивается среднее арифметическое последовательных значений рангов.

Например, две единицы, занимающие в едином ранжированном ряду 2 и 3 место (ранг), имеют одинаковые значения. Следовательно, каждой из них присваивается ранг равный (3 + 2) / 2 = 2,5.

В составленном едином ранжированном ряду общее количество рангов получится равным:

N = n1 + n2

где n1 - количество элементов в первой выборке, а n2 - количество элементов во второй выборке.

Далее вновь разделяем единый ранжированный ряд на два, состоящие соответственно из единиц первой и второй выборок, запоминая при этом значения рангов для каждой единицы. Подсчитываем отдельно сумму рангов, пришедшихся на долю элементов первой выборки, и отдельно - на долю элементов второй выборки. Определяем большую из двух ранговых сумм (Tx) соответствующую выборке с nx элементами.

Наконец, находим значение U-критерия Манна-Уитни по формуле:

Как интерпретировать значение U-критерия Манна-Уитни?

Полученное значение U-критерия сравниваем по таблице для избранного уровня статистической значимости (p=0.05или p=0.01) с критическим значением U при заданной численности сопоставляемых выборок:

  • Если полученное значение U меньшетабличного или равноему, то признается статистическая значимость различий между уровнями признака в рассматриваемых выборках (принимается альтернативная гипотеза). Достоверность различий тем выше, чем меньше значение U.
  • Если же полученное значение U большетабличного, принимается нулевая гипотеза.

 

N1

N2

7 8 9 10 11 12 13 14 15 16 17 18 19 20
3 1 2 2 3 3 4 4 5 5 6 6 7 7 8
4 3 4 4 5 6 7 8 9 10 11 11 12 13 13
5 5 6 7 8 9 11 12 13 14 15 17 18 19 20
6 6 8 10 11 13 14 16 17 19 21 22 24 25 27
7 8 10 12 14 16 18 20 22 24 26 28 30 32 34
8 10 13 15 17 19 22 24 26 29 31 34 36 38 41
9 12 15 17 20 23 26 28 30 34 37 39 42 45 48
10 14 17 20 23 26 29 33 36 39 42 45 48 52 55
11 16 19 23 26 30 33 37 40 44 48 51 55 58 62
12 18 22 26 29 33 37 41 45 49 53 57 61 65 69
13 20 24 28 33 37 41 45 50 54 59 63 67 72 76
14 22 26 30 36 40 45 50 55 59 64 67 74 78 83
15 24 29 34 39 44 49 54 59 64 70 75 80 85 90
16 26 31 37 42 48 53 59 64 70 75 81 86 92 98
17 28 34 39 45 51 57 63 67 75 81 87 93 99 105
18 30 36 42 48 55 61 67 74 80 86 93 99 106 112
19 32 38 45 52 58 65 72 78 85 92 99 106 113 119
20 34 41 48 55 62 69 76 83 90 98 105 112 119   127  

 

Дисперсионный анализ в обработке результатов эксперимента

Для того чтобы определить, являются ли полученные в эксперименте результаты статистически достоверными, т.е. отражают ли они реальные связи переменных в генеральной совокупности или были получены на использованной в исследовании выборке случайно, необходимо провести статистический анализ. Для обработки результатов факторных экспериментов используется дисперсионный анализ ANOVA, общая идея которого более подробно была рассмотрена в предыдущей главе.

 

Напомним, что ANOVA позволяет делать заключения о достоверности различий в средних значениях на основании анализа разных компонентов дисперсии. Для межгруппового однофакторного случая рассматривались два компонента дисперсии: вариативность, обусловленная влиянием независимой переменной (межгрупповая дисперсия), а также вариативность, обусловленная случайными влияниями и ошибкой (внутригрупповая дисперсия). Статистическим показателем, рассчитываемым в ANOVA, является F-отношение (отношение межгрупповой составляющей дисперсии к ее внутригрупповой составляющей). ANOVA проверяет нулевую гипотезу о том, что дисперсия основных эффектов и взаимодействие переменных не отличается от нуля, т.е. что все средние значения зависимой переменной, полученные на разных уровнях независимой, в популяции равны между собой.

 

Для обработки результатов межсубъектных, внутрисубъектных и смешанных факторных экспериментов применяются разные структурные модели ANOVA, различающиеся особенностями производимых расчетов, поэтому очень важно четко представлять, какие переменные каким образом предъявлялись испытуемым: внутрисубъектно или межсубъектно.

 

Для того чтобы иметь возможность применять ANOVA к полученным данным, необходимо выполнение лежащих в его основе допущений.

 

Применительно к межсубъектным факторам критическим является допущение о равенстве дисперсий во всех ячейках факторной матрицы (которое проверяется при помощи теста Ливиня), несоблюдение которого может сказаться на результатах в случае, если количество испытуемых в разных условиях различается. Поэтому при несоблюдении этого допущения рекомендуется выровнять количество испытуемых в разных условиях.

 

Применительно к внутрисубъектным факторам важным является допущение о сферичности ковариационно-вариационных матриц (которое проверяется при помощи теста Моучли), и в случае его несоблюдения необходимо использовать дополнительные процедуры коррекции показателей ANOVA или мультивариативные тесты MANOVA.

 

В математической модели многофакторного A NOVA межгрупповая составляющая дисперсии делится на несколько составляющих — связанную с влиянием каждого из изучаемых факторов (основные эффекты) и связанную с влиянием взаимодействия (или нескольких взаимодействий). Для каждого из этих влияний проверяется своя нулевая гипотеза и подсчитывается свое /^отношение. Таким образом, при использовании ANOVA для обработки факторных планов одновременно формулируется и проверяется целая группа нулевых гипотез.

 

При использовании двух независимых переменных А и В и межгруппового плана в ANOVA будут выделены следующие компоненты дисперсии: внутригрупповая и межгрупповая, которая, в свою очередь, будет разделена на дисперсию, обусловленную влиянием фактора А, дисперсию, обусловленную влиянием фактора В, и дисперсию, обусловленную взаимодействием факторов А и В.

 

Формально значение зависимой переменной для испытуемого k в группе ij, соответствующей і-му уровню фактора А и j-му уровню фактора В, может быть выражено следующим образом:

 

где м — популяционная константа; α— эффект фактора А на уровне і; β; — эффект фактора В на уровне j, αβij— взаимодействие этих факторов;

 

εijk ~ эффект некотролируемых побочных переменных (экспериментальной ошибки).

 

Тогда проверке будет подлежать три набора статистических гипотез:

 

1. Относительно основного эффекта от фактора А:

 

Н0: эффект фактора А отсутствует; средние значения для всех уровней независимой переменной А равны между собой, σα2 =0.

 

Н1 эффект фактора А присутствует; средние значения хотя бы для двух уровней независимой переменной А различаются, σα2>0.

 

2. Относительно основного эффекта от фактора В:

 

Н0: эффект фактора В отсутствует; средние значения для всех уровней независимой переменной В равны между собой, σβ2=0.

 

Hj: эффект фактора В присутствует; средние значения хотя бы для двух уровней независимой переменной В различаются, σβ2>0.

 

3. Относительно взаимодействия факторов А и В:

 

Н0: взаимодействие факторов А и В отсутствует; значение зависимой переменой можно однозначно определить, суммируя эффекты факторов А И В. σαβ =0.

 

Hj: взаимодействие факторов А и В присутствует; значение зависимой переменой невозможно однозначно определить, суммируя эффекты факторов А и В, σαβ > 0.

 

Проверка этих наборов статистических гипотез осуществляется, как правило, независимо относительно оценки внутригрупповой дисперсии σε2. Для каждого из них подсчитывается свое F-отношение и его p-уровень. В случае если р не превышает минимально допустимого критического уровня в 0,05, нулевая гипотеза может быть отклонена, и можно делать вывод о существовании соответствующего основного эффекта или взаимодействия в популяции. Если же значение р-уровня превысило 0,05, нулевая гипотеза может быть принята, и тогда необходимо сделать вывод об отсутствии в генеральной совокупности соответствующего эффекта или взаимодействия. Таким образом, в результате эксперимента может быть получен статистически значимый основной эффект (для одной из переменных или для большего их количества) и не получено взаимодействия, получено взаимодействие и не получено основных эффектов и т.д.

 

Если нулевая гипотеза относительно основного эффекта отклонена и делается вывод о том, что данный фактор оказывает влияние на зависимую переменную, могут потребоваться дополнительные процедуры оценки контрастов, чтобы выяснить, различия для каких именно уровней данного фактора статистически значимы. Очевидно, что этого не нужно делать, если фактор представлен только двумя уровнями, так как в этом случае обнаружение основного эффекта и будет свидетельствовать о том, что различия для этих уровней значимы. Процедуры оценки контрастов анализа в многофакторном ANOVA аналогичны его однофакторному варианту.

 

В случае, если обнаружено статистически значимое взаимодействие (нулевая гипотеза для него отклонена), необходимо осуществить его содержательный анализ. Главное — помнить, что при описании результатов недостаточно простой фразы "обнаружено статистически значимое взаимодействие", обязательно должно быть уточнено, в чем именно оно заключается, как именно меняется влияние одной независимой переменной па разных уровнях другой, причем лучше сопроводить эти слова графиком. Это также можно сделать на основе различных процедур оценки контрастов.

 

Если обрабатывается факторный план с тремя независимыми переменными, то количество проверяемых в AN OVA статистических гипотез увеличится. В этом случае будет подсчитано семь F-отношений для следующих гипотез:

 

1) об основном эффекте фактора Л;

 

2) об основном эффекте фактора В:

 

3) об основном эффекте фактора С;

 

4) о взаимодействии факторов А и В

 

5) о взаимодействии факторов А и С;

 

6) о взаимодействии факторов В и С;

 

7) о взаимодействии факторов Л, В и С.

 

Взаимодействия двух факторов будут называться взаимодействием первого порядка, а взаимодействие трех факторов — взаимодействием второго порядка.

 

В действительности интерпретация взаимодействия второго порядка может оказаться сложной, так как здесь теоретически возможны три равновероятных объяснения:

 

- взаимодействие факторов А и В различается на разных уровнях переменной С;

 

- взаимодействие переменных А и С различается на разных уровнях переменной В;

 

- взаимодействие переменных В и С различается на разных уровнях переменной А.

 

Содержательно проанализировать взаимодействие такого рода сложно, особенно если изначально у исследователя не было экспериментальных и теоретических гипотез относительно такого рода результатов. Именно поэтому обычно без необходимости и более-менее четких представлений о возможности таких влияний экспериментаторам не рекомендуется использовать факторные планы с большим количеством независимых переменных.

 

Современные статистические пакеты позволяют обрабатывать факторные эксперименты любых структур (межсубъектные, внутрисубъектные, смешанные) и любых уровней сложности. Главное — понимать, по какой схеме предъявлялась каждая переменная, правильным образом вводить данные в статистические пакеты и помнить, какие допущения должны быть выполнены и для каких переменных, а также какие методы оценки контрастов могут быть применены.

 

Когда в отчетах или статьях излагаются результаты ANOVA для факторных экспериментов, необходимо приведение следующих показателей.

 

1. Описательная статистика по зависимой переменной для каждого из экспериментальных условий. Обычно это делается в виде факторной матрицы, примеры которых вы видели в двух предыдущих параграфах.

 

2. F-отношения и p-уровни его значимости для каждой проверяемой статистической гипотезы (т.е. для каждого основного эффекта и взаимодействия).

 

3. Результаты парных сравнений средних (оценки контрастов) с указанием значимости различий для разных сравниваемых пар значений. Эти результаты приводятся, если для фактора, содержащего более двух уровней, обнаружен значимый основной эффект.

 

4. Если обнаружено значимое взаимодействие, необходимо привести график, иллюстрирующий его особенности, и описать, в чем именно заключается взаимодействие.

 

Кроме этого, при использовании ANOVA в обработке результатов можно проводить более детальный анализ. Например, изучать так называемые простые эффекты — выяснять наличие различий между средними для одной независимой переменной на отдельных уровнях другой независимой переменной.

 


Дата добавления: 2018-02-28; просмотров: 746; ЗАКАЗАТЬ РАБОТУ