Основные этапы выбора критерия
1. Определить, является ли выборка зависимой или независимой
Две выборки зависят друг от друга, если каждому значению одной выборки можно закономерным и однозначным способом поставить в соответствие ровно одно значение другой выборки. Или связанными называют такие выборки, в которых каждому наблюдению в опыте соответствует свой контроль, т.к. он связан с опытом единством каких-либо условий эксперимента. Например, это исходный уровень измеряемого параметра у того же испытуемого. Если закономерное и однозначное соответствие между выборками невозможно, то выборки являются независимыми. Независимые выборки – это, например, экспериментальная и контрольная.
2. Определить однородность – неоднородность выборки
Основанием для формирования однородной выборки могут служить разные характеристики объекта исследования, такие как уровень обученности, национальность, отсутствие определенных заболеваний и т.д., в зависимости от целей исследования.
3. Оценить объем выборки, и зная ограничения каждого критерия по объему, выбрать соответствующий критерий
При этом целесообразнее всего начинать работу с выбора наименее трудоемкого критерия. Если используемый критерий не выявил различия – следует применить более мощный, но одновременно и более трудоемкий критерий.
При малом объеме выборки следует увеличить величину уровня значимости (не менее 1%), т.к. небольшая выборка и низкий уровень значимости приводят к увеличению вероятности принятия ошибочных решений.
|
|
Выбор непараметрическогокритерия различия зависит от характера нулевой гипотезы, связанности выборок и объема выборки (табл. 2).
Таблица 2. Выбор непараметрического критерия различия
Номер случая | В чем состоит нулевая гипотеза | Связанность выборок | Объем выборки | Критерии |
1 | Нет различий в центральных тенденциях распределений | Связанные (парные) | 6-25 | G, Т, ТМФ, U |
Связанные | 26-300 | G | ||
Связанные | 2-5 | ТМФ, U | ||
Независимые | 2-10 | ТМФ, U | ||
Независимые | 11-20 | Q, ТМФ, U | ||
Независимые | 21-60 | Q, U | ||
Независимые | > 60 | Q | ||
2 | Нет различий в распределениях | Независимые | 2-20 | r |
Независимые | > 20 | U |
В табл. 2: критерий G (критерий знаков), критерий Т (Вилкоксона), ТМФ – точный метод Фишера, критерий U (Манна – Уитни), критерий Q (Розенбаума), серийный критерий r (Вальда-Вольфовица) [].
Рекомендуется применять критерии в порядке их перечисления. Каждый следующий критерий применяется, если предыдущий не выявил различий.
Алгоритм применения непараметрических критериев
Данные. Для исследования нужны однородные объекты, разделенные на две группы. Взаимные влияния и взаимодействия должны быть исключены. Для каждого объекта регистрируется некоторая его числовая характеристика. Возникающие при этом две группы чисел можно рассматривать как две независимые выборки.
|
|
Постановка задачи. Какие задачи наиболее часто рассматриваются при сравнении двух выборок? Обычно две выборки получаются как результаты применения различных условий эксперимента к двум группам испытуемых, однородных по своему составу. Изменение условий эксперимента обычно сказывается на изменении положения распределения измеряемой числовой характеристики на числовой прямой. Масштаб и форма распределения при малых изменениях условий эксперимента обычно остаются практически неизменными. При больших изменениях наряду с изменением положения распределения изменяется и его дисперсия. Крайне редко происходит изменение самой формы распределения, поэтому при исследовании различий в двух выборках обычно предполагают, что законы распределения двух анализируемых выборок отличаются только сдвигом и относятся к сдвиговому семейству распределений.
Оценка достоверности сдвига в значениях исследуемого признака
Под сдвигами понимаются достоверные изменения в измеряемых показателях. Сдвиг – это разность между вторым и первым измерениями. Встречаются следующие виды сдвигов:
|
|
временные, когда сопоставляются показатели, полученные у одних и тех же испытуемых по одним и тем же методикам, но в разное время (например, проведение повторных контрольных мероприятий);
ситуационные, когда сопоставляются показатели, полученные одним и тем же методом, но в разных условиях измерения (ситуациях);
умозрительный сдвиг, когда сопоставляются показатели в обычных и воображаемых условиях;
структурные, когда сопоставляются разные показатели (вербальные и числовые; ранги и баллы и т.д.) одних и тех же испытуемых.
Во всех этих случаях мы имеем дело о сдвигах под влиянием контролируемых или не контролируемых воздействий. С целью установления сдвигов используют экспериментальные группы (в которых используется экспериментальный, т.е. проверяемый фактор) и контрольные (ЭГ и КГ). Они должны быть «уравновешены» по всем значимым для исследования признакам (полу, возрасту, обученности и т.д.), т.е. стратифицированы и репрезентативны. Следует иметь в виду, что добиться (ЭГ)0 ≈ (КГ)0 , т.е. idem перед экспериментом практически невозможно (здесь: idem – одинаковый).
|
|
В ходе эксперимента мы почти никогда не можем быть уверены, что выявленные различия (сдвиги) объясняются только действием исследуемых факторов, а не различиями между двумя выборками.
Когда, например, у одной группы студентов измеряются «начальный уровень обученности», а «остаточные знания» – у другой, то, строго говоря, сравнивать эти результаты нельзя, хотя часто это делается.
В табл. 3 представлена классификация сдвигов и критериев их статистической достоверности.
Таблица 3. Классификация сдвигов и критериев оценки их статистической достоверности
Виды сдвигов | Объект сопоставлений | Условия | Критерии оценки достоверности сдвига | |
Кол-во замеров | Кол-во групп | |||
1. Временные, ситуационные, умозрительные, измерительные | Одни и те же показатели, измеренные у одних и тех же испытуемых в разное время, в разных ситуациях, в разных представляемых условиях или разными способами | 2 | 1 | G – критерий знаков; Т – критерий Вилкоксона |
3 и более | 1 | L – критерий тенденций Пейджа; – критерий Фридмана |
продолжение табл. 3
2. Сдвиги под влиянием экспериментальных воздействий | Одни и те же показатели, измеренные у одних и тех же испытуемых до и после воздействия: а) при отсутствии контрольной группы; | 2 | 1 | G – критерий знаков; Т – критерий Вилкоксона |
3 и более | 1 | L – критерий тенденций Пейджа; – критерий Фридмана | ||
б) при наличии контрольной группы | 2 | 2 | Вариант 1 – сопоставление значений «до» и «после» отдельно по экспериментальной и контрольной группам: G – критерий знаков; Т – критерий Вилкоксона. Вариант 2 – сопоставление сдвигов в двух группах: Q – критерий; U – критерий Манна-Уитни; φ * – критерий Фишера | |
3 и более | 2 | Сопоставление значений отдельно по экспериментальной и контрольной группам: L – критерий тенденций Пейджа; – критерий Фридмана. | ||
3. Структурные сдвиги | Разные показатели одних и тех же испытуемых | 2 | 1 | G – критерий знаков; Т – критерий Вилкоксона. |
3 и более | 1 | L – критерий тенденций Пейджа; – критерий Фридмана |
Как следует из таблицы, при сопоставлении двух замеров, произведенных на одной и той же (ЭГ) выборке, применяются критерии знаков G и критерий Т Вилкоксона. При сопоставлении трех и более замеров, произведенных на одной и той же выборке, применяются критерий тенденций L Пейджа, а если он неприменим из-за большого объема выборок – критерий Фридмана.
В тех случаях, когда мы хотим оценить различия в интенсивности сдвига в двух группах испытуемых (КГ и ЭГ или двух ЭГ), мы можем использовать различные варианты сопоставлений: 1) производить сопоставления отдельно в двух группах, используя критерии L и ; 2) сопоставлять показатели сдвига в двух группах.
Во второй главе рассмотрим применение непараметрических критериев на примерах.
Дата добавления: 2018-09-22; просмотров: 611; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!