Логика проверки статистических гипотез. Статистические критерии
Статистический критерий (statistical test) – статистический метод принятия решения о том, стоит ли отвергнуть нулевую гипотезу в пользу альтернативной или нет, соответствующий особенностям выборки.
• Эмпирическое значение критерия (или расчётное) рассчитывается определённым статистическим способом
• Критическое значениекритерия - известное (например, заданное таблично) эталонное значение соответствующее определённому уровню значимости ( 5% (0,05), 1% (0,01) и т.д.) при различных степенях свободы.
• Для многих критериев (не для всех) если эмпирическое значение критерия для данного числа степеней свободы (df)оказывается меньше или равно критическому, то нулевая гипотеза не может быть отклонена – считается, что на заданном уровне значимости (значении a, для которого рассчитано критическое значение критерия) выявленная разница (или связь) является недостоверной и характеристики групп совпадают на уровне значимости альфа.
• Если эмпирическое значение критерия оказывается строго больше критического, то нулевая гипотеза отвергается и принимается альтернативная гипотеза – характеристики распределений считаются различными с достоверностью различий 1 – α (например, 1- 0,05 = 0,95 или достоверность различий равна 95%).Чем эмпирическое значение критерия больше критического значения, тем сильнее различаются характеристики сравниваемых объектов.
Процедура проверки статистической гипотезы
|
|
• Сформулировать нулевую и альтернативной гипотезы.
• Выбрать соответствующий статистический тест (критерий).
• Выбрать требуемый уровень значимости (α=0.05, 0.01, 0.025, …).
• Вычислить эмпирическое значение критерия по тесту.
• Сравнить с критическим значением критерия по тесту при заданном критическом уровне значимости.
• Принять решение (для большинства тестов приемлемо правило: если вычисленное значение больше, чем критическое, нулевая гипотеза отклоняется).
Классификация статистических методов (критериев)
По количеству анализируемых признаков:
· одномерные (анализ каждого признака в отдельности);
· двухмерные (одновременный анализ двух признаков, например анализ связей изучаемых признаков - ассоциации или корреляции);
· многофакторные(анализ трех признаков и более одновременно, например многофакторный дисперсионный анализ, многофакторный регрессионный анализ, дискриминантный анализ).
По статистическим принципам, лежащим в основе методов:
• параметрические - применяются для анализа нормально распределенных количественных признаков (метрические шкалы – интервальные или относительные). Требуют вычисления средних величин и показателей вариации.
|
|
• непараметрические -применяются в остальных случаях:
o для анализа количественных признаков независимо от вида их распределения (не требуют, чтобы данные подчинялись какому-то определённому типу распределения);
o для анализа маленьких по размеру выборок.
o для анализа качественных признаков (неметрические шкалы – номинальные или порядковые).
В целом непараметрические методы (в случае использования их на малых выборках) являются менее мощными по сравнению с параметрическими, т.е. иногда не позволяют выявить статистические закономерности, которые могут быть выявлены с помощью параметрических методов, но они более надежны в случаях, когда есть сомнения в том, что анализируемый признак имеет нормальное распределение.
Для получения нормального распределения исходные данные можно преобразовать, например, с помощью логарифма. При этом нельзя брать логарифмы отрицательного значения или нуля.
По возможности учета имеющихся априори предположений:
• односторонние тесты - учитывают исходное (априорное) предположение о том, что в одной из групп распределение признака смещено в определенную сторону (в сторону увеличения либо уменьшения) по отношению к другой. Другими словами, направление эффекта задано. Для того чтобы воспользоваться таким тестом, необходимо обосновать свое предположение.
|
|
• двусторонние тесты - используются в отсутствие исходного предположения о том, что в одной из групп распределение признака смещено в определенную сторону (в сторону уменьшения или увеличения) по отношению к другой. Другими словами направление эффекта заранее не известно. Двусторонние тесты рекомендуется использовать как можно шире.
По зависимости или независимости сопоставляемых выборок:
• тесты для независимых выборок. Используются в случае, если при формировании выборок объекты исследования набирались в группы независимо друг от друга (например, были рандомизированы в две группы). В независимых выборках вероятность отбора любого испытуемого одной выборки не зависит от отбора любого из испытуемых другой выборки.
• тесты для зависимых выборок. Используются для анализа динамики показателей, полученных в одной группе.
Дата добавления: 2018-04-05; просмотров: 675; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!