Классификация наиболее важных статистических методов
Статистические методы сравнения 2-х выборок
Вид тестовых шкал | Вид данных | Зависимые выборки | Независимые выборки | ||
Параметрический | Непараметрический | Параметрический | Непараметрический | ||
Номинальная (наименований) | Качественные: номинальные категориальные (nominal, categorical) | - | Критерий МакНемара | - | Критерий хи-квадрат Пирсона (критерий согласия) |
Порядковая (ранговая, ординальная) | Качественные: порядковые, ранговые, ординальные (ordinal) | - | Критерий знаков Вилкоксона | - | U-критерий Манна-Уитни Критерий ранговых сумм Вилкоксона Критерий Колмогорова-Смирнова |
Интервальная (разностей) | Количественные: дискретные (descrete), непрерывные (continious) | t-критерий Стьюдента (независимые выборки) | Критерий знаков Вилкоксона
| t-критерий Стьюдента (независимые выборки) | U-критерий Манна-Уитни Критерий ранговых сумм Вилкоксона Критерий Колмогорова-Смирнова |
Абсолютная (отношений) |
Алгоритм выбора статистического критерия
- Нормальное распределение
–Параметрические методы:
- Количественные переменные: критерий Стьюдента для зависимых или независимых выборок (ограничение по равенству дисперсий в выборках).
- Распределение, отличающееся от нормального
-Непараметрические методы:
- Бинарные переменные:
- ожидаемые значения менее 5 – тест Фишера (параметр.).
- ожидаемые значения более 5:
|
|
- независимые выборки: тест хи-квадрат.
- зависимые выборки: тест МакНемара.
- Непрерывные данные:
- Непрерывные данные:
- Зависимые выборки: знаковый ранговый тест Вилкоксона.
- Независимые выборки: тест Манна-Уитни.
Сравнение 2-х выборок по 1-му признаку
А. Параметрические критерии – количественные нормально распределённые данные
Критерий Стьюдента (t-критерий Стьюдента)
t-критерий Стьюдента (псевдоним У. Госсета) является наиболее распространённым параметрическим критерием. Позволяет проверить гипотезу о статистической значимости разности двух арифметических средних в 2-х зависимых или независимых выборках.
Нулевая гипотеза – отсутствие различий средних арифметических значений переменной в двух выборках. В нулевой гипотезе используемая статистика соответствует t-распределению.
Характеристики t-распределения:
· близко к нормальному, но кривая более приплюснута, с более длинными «хвостами»;
· характеризуется степенями свободы, форма приближается к нормальной по мере увеличения степеней свободы.
|
|
Требования к выборкам (математические допущения)
· Нормальность распределения переменных в обеих выборках.
· Одинаковость дисперсии (стандартного отклонения).
· Допускается сравнение не более 2-х групп.
· Группы могут большие (n>30), малые или не равными по размеру. Однако, в маленьких выборках трудно установить характер распределения.
t-критерий Стьюдента имеется в 2-х вариантах: для зависимых и для независимых выборок. В статистических программах и калькуляторах используются соответствующие варианты теста.
Алгоритм выполнения теста
· Необходимо проверить выборки на нормальность и равенство дисперсий.
· В меню выбирается соответствующий вид теста:
o для зависимых или независимых выборок (парный или непарный тест).
o двусторонний или односторонний.
· Задаётся критический уровень значимости.
· Вводятся варианты.
· Программа рассчитывает число степеней свободы, полученное (расчётное) значение t-критерия и точное значение достигнутого уровня значимости р. В независимых выборках число степеней свободы равно: df = пэ + пк - 2, где пэ и пк - общее число индивидуальных результатов в 2-х группах. В зависимых выборках df = n – 1, где n – число сопряженных пар.
|
|
· Оценка.
o полученное (расчётное, эмпирическое) значение tсравнивается с граничным значением (критическим значением) при 5 %-ном (или другом заданном) уровне значимости (t0,05) при имеющемся числе степеней свободы. Возможно прямое сравнение достигнутого уровня статистической значимости (р) с критическим.
o Если расчётное tбольше граничного значения, то различия между средними арифметическими двух групп считаются статистически значимыми при 5%-ном уровне значимости (p < a).
o В случае когда полученное t расчётное меньше граничного значения t0,05, считается, что различия статистически не значимы и разница в среднеарифметических показателях групп имеет случайный характер (p > a).
В. Сравнение 2-х групп – качественные данные
Дата добавления: 2018-04-05; просмотров: 480; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!