Применение непараметрической и параметрической статистики при обработке эмпирических данных

⇐ ПредыдущаяСтр 12 из 19Следующая ⇒

Методы непараметрической статистики применяются в тех случаях, когда показатели тестов распределены ненормально или распределение неизвестно. Существует определение: «Непараметрические методы статистики - методы математической статистики, не предполагающие знание функционального вида генеральных распределений». Распространение методов непараметрической статистики сдерживается отсутствием учебных пособий по этому предмету. История непараметрических методов начинается с использования критериев знаков Арбетноттом в 1710 г. Во второй половине XIX в. Фехнер и Гальтон стали применять ранги и коэффициенты ранговой корреляции. Работами Спирмена (1904) к ранговым методам было привлечено внимание научной общественности, а работы Колмогорова (1933), Смирнова(1935), Уилкоксона (1945), Сигеля (1956) и др. создали непараметрическую статистику как самостоятельную ветвь математической статистики.

Для определения статистических зависимостей в непараметрической статистике предназначены:

· мода (М_о);

· медиана (М_е);

· критерии Манна-Уитни, Уилкоксона, Хи-квадрат;

· коэффициенты ассоциации (Ф) и контингенции (Q);

· преобразованный коэффициент корреляции Пирсона (φ);

· коэффициент сопряженности Пирсона (С) (для больших выборок);

· коэффициент сопряженности Чупрова (К) (для M_x N-клеточной сопряженности);

· коэффициент ранговой корреляции Спирмена (R_s) и др.

В практической работе психологов и, в частности, в профотборе для статистической оценки связей эмпирических переменных используют следующие коэффициенты:

а) в шкале наименований: коэффициент согласия Пирсона (χ²), коэффициенты контингенции (Q) и ассоциации (Ô) (для 4-клеточной сопряженности), коэффициенты взаимной сопряженности Пирсона (С) и Чупрова (К) (для m_х n-клеточной сопряженности).

б) в шкале порядков: коэффициент ранговой корреляции Спирмена (R_s).

в) меры центральной тенденции:

1) Мода (М_о) - наиболее вероятное появление показателя.

2) Медиана (М_е) - вариант, приходящийся на середину ранжированного вариационного ряда.

г) меры связи и статистического вывода:

3) Критерий Манна -Уитни основан на парном сравнении результатов из первой и второй выборок.

4) Критерий Уилкоксона эквивалентен критерию Манна -Уитни и основан на переходе от наблюдений к их рангам.

5) Коэффициент согласия Пирсона (χ²) основан на приближении частоты проявления признака в различных выборках, измеренного в номинальной шкале. Расчет осуществляется по формуле:

χ²= Σ (n_i¹ — n_i²)²/ n_i²,

где n_i¹ - частоты тестовых данных: частота (Р¹) проявления свойства у первого испытуемого;

n_i²- частоты тестовых данных: частота (Р²) проявления свойства у второго испытуемого.

6) Для определения статистической связи переменных, измеренных в дихотомической шкале наименований, используются коэффициенты контингенции (Q) и ассоциации (Ô).

;

7) Для определения статистической связи переменных, измеренных в порядковой шкале, используют коэффициент ранговой корреляции Спирмена (R_s), который вычисляется по формуле:

Теоретическая интерпретация коэффициента ранговой корреляции Спирмена R_s идентична любой статистике из области измерения связей переменных. Если значение R_s более 0.5, то имеет место статистически сильная связь, если менее 0.5 — слабая. Положительные и отрицательные знаки показывают направленность связи (соответственно, прямая и обратная).

Параметрическая статистика применяется в тех случаях, когда тестовые показатели измерены в интервальной шкале, шкале отношений или абсолютной шкале при соблюдении распределения Гаусса. В данном случае применяются методы анализа данных при помощи моды, медианы и среднего (М_о; М_е; М_х) [меры центральной тенденции], дисперсии и среднего квадратического отклонения (D_х; δ_х), коэффициента вариации (V) [меры изменчивости], коэффициента корреляции Пирсона (R_xy)[меры связи], t-критерия Стъюдента, υ-критерия Уэлша, F-критерия Фишера [статистический вывод] и психодиагностического прогнозирования при помощи методов линейной и нелинейной регрессии [модели регрессии].

Статистические методы применяются в определенном доверительном интервале, который задается исходя из потребностей точности измерений. Доверительным интервалом называется интервал (X ± e), который "накрывает" неизвестный параметр с заданной точностью. В биологических и социальных исследованиях максимальное значение e задается в пределах 5%. То есть e £ 0.05.

8) Основной мерой центральной тенденции в параметрическом измерении является среднее значение - математическое ожидание (М_х). Это сумма всех измеренных значений свойства, отнесенное к количеству этих измерений.

М_х = å x_i/ n,

где x_i — i-е значение свойства;

n — количество измерений.

9) Изменчивость признаков в параметрических шкалах измеряется при помощи дисперсии и среднего квадратического отклонения (δ_х). Среднее квадратическое отклонение определяется как арифметическое значение квадратного корня из дисперсии - среднего арифметического квадратов отклонений отдельных значений измеренного свойства от их среднего значения.

10) Коэффициент корреляции Пирсона (R_xy) показывает наличие статистической связи между психологическими переменными х и у, при которой каждой переменной х соответствует не одно или несколько определенных значений у, а распределение у, меняющееся вместе с изменением х, которое может быть однонаправленным (+) и разнонаправленным (-).

где x_i - значение показателя первой переменной;

y_i - значение показателя второй переменной;

N - объем выборки.

Теоретическая интерпретация коэффициента корреляции Пирсона R_xy подобна другим статистикам из области измерения связей между переменными. Если значение R_xy более 0.5, то имеет место статистически сильная связь, если менее 0.5 — слабая. Положительные и отрицательные знаки показывают направленность связи (соответственно, прямая и обратная).

11) При определенном количестве измерений (n) корреляционные связи могут быть значимыми и незначимыми. Исследователю необходимо это знать для того, чтобы сделать достоверный вывод о причинно-следственных связях переменных. Уровень значимости коэффициентов корреляции определяется по формуле расчета t-критерия при помощи таблиц "Квантилей t-распределения Стъюдента для доверительной вероятности".

где R — численное значение коэффициента корреляции;

n — объем выборки.

12) Точечный биссериальный коэффициент корреляции Пирсона (R_pb) — метод корреляционного анализа отношения переменных, одна из которых измерена в дихотомической шкале наименований, а другая — в интервальной шкале отношений или порядка. Точечно-биссериальный коэффициент корреляции применяется также для определения дискриминативности заданий тестов.

R_pb = [(M_x — M_о) / δ_x] √ n₁ n_о / n (n — 1),

где M_x - среднее по Х объектов со значением 1 по Y;

M_о - среднее по Х объектов со значением 0 по Y;

δ_x - стандартное отклонение всех значений по Х;

n₁ - число объектов с 1 по Y;

n_о - число объектов с 0 по Y;

n - общее число объектов.

Интервал измерения R_pb от –1 до +1. Теоретическая интерпретация значений подобна R_xy.

13) Расчет коэффициентов корреляции является инструментом, позволяющим осуществить корреляционный, факторный и кластерный анализ эмпирических данных.

Корреляционный анализ — метод исследования взаимозависимости признаков в генеральной совокупности, являющихся случайными величинами, имеющими нормальное многомерное распределение. Для наглядности интеркорреляционные показатели представляются в виде таблиц корреляций переменных, матриц и графов.

Факторный анализ — раздел многомерного статистического анализа, сущность которого заключается в выявлении непосредственно неизмеряемого признака, являющегося "главной компонентой" (производной) группы измеренных тестовых показателей.

Кластерный анализ — совокупность статистических (и иных, в том числе качественных) методов, предназначенных для дифференциации относительно отдаленных друг от друга групп и близких между собой объектов по информации о связях (мерах близости) между ними.

14) t-критерий Стъюдента, υ-критерий Уэлша, F-критерий Фишера представляют собой методы статистического вывода о наличии значимой связи между признаками или выявления признака, характеризующего генеральную совокупность. На практике они применяются для оценки подобия двух групп испытуемых, у которых измерены определенные свойства, по средней и дисперсии тестовых данных. t-критерий в отличие от υ-критерия применяется в ситуации равенства средних квадратических отклонений. F-критерий определяет подобие выборок по дисперсии их эмпирических переменных.

;

где М_х - средние значения тестовых данных;

n - количество испытуемых;

δ - среднеквадратическое отклонение.

Анализ результатов исследования при помощи t -критерия осуществляется по следующему алгоритму:

а) производится расчет значений t-критерия;

б) по количеству испытуемых осуществляется вход в таблицу "Квантилей t-распределения Стъюдента..."(см. табл.);

в) значение расчетного t-критерия (t_p) сравнивается с табличным значением (t_т);

г) если t_p > t_т, то выборки значимо различаются на уровне доверительной вероятности;

д) если t_p < t_т, то группы испытуемых принадлежат одной совокупности.

Дата добавления: 2016-01-05; просмотров: 33; Мы поможем в написании вашей работы!

Поделиться с друзьями:

⇐ Предыдущая 7 8 9 10 111213 14 15 16 Следующая ⇒

Мы поможем в написании ваших работ!