СТАНДАРТИЗАЦИЯ ПСИХОДИАГНОСТИЧЕСКИХ МЕТОДОВ



 

При разработке любой психодиагностической методики подразумевается, что она будет использоваться не разово, а многократно. Чтобы методика, результаты которой выражаются в том или ином числовом виде, могла быть применена впоследствии широким кругом специалистов-психологов, она должна быть стандартизирована. Стандартизацией психодиагностических методов называется процедура получения шкалы, позволяющей сравнивать индивидуальный результат по тесту с результатами большой группы испытуемых. Итогом такой работы являются так называемые тестовые нормы или таблицы пересчета первичных (“сырых”) данных в стандартные. В качестве точки отсчета, по отношению к которой можно оценивать степень выраженности того или иного психологического свойства, берется средний результат по большой группе испытуемых.

Обычная последовательность стандартизации психодиагностической методики состоит в следующем:

n Определяется генеральная совокупность, для которой предназначена методика, и из нее извлекается выборка.

n По результатам исследования выборки строится эмпирическое распределение, которое проверяется на соответствие его нормальному виду с помощью статистических критериев (например, критерия c2 Пирсона или l Колмогорова-Смирнова, о которых речь пойдет ниже).

n Если распределение нормальное, то строится стандартизированная шкала. Если же распределение отличается от нормального контрастно, то следует либо изменить формулировки вопросов теста, либо более строго определить границы генеральной совокупности и выборки, либо принять другие меры, чтобы приблизить распределение полученных результатов к нормальному.

n Согласно полученной стандартизированной шкале выборка разбивается на группы, про которые известно, какой процент испытуемых они включают. При использовании методики в дальнейшем каждый новый индивидуальный результат можно будет быстро отнести в одну из групп и точно определить степень выраженности психологического свойства у испытуемого.

Наиболее распространенной является шкала Z-оценки (или Z-показателя, о котором уже было сказано выше).

 

В z-шкале центральным является среднее арифметическое значение, а от него вправо и влево откладываются значения через интервалы, пропорциональные величине стандартного отклонения (обычно интервалы равны 1s). Количество групп может быть 5 или 7. При 5 группах “средними” считаются результаты Z от -1 до 1 (группа 3, куда попадает 68.26% испытуемых) (Таблица3), результаты Z от 1 до 2 называются “выше среднего” (группа 4 - 13.59% испытуемых), при Z выше 2 - “высокими” (группа 5 - 2.28% испытуемых), при Z от -1 до -2 - “ниже среднего” (группа 2 - 13.59% испытуемых), Z ниже -2 - “низкими” (группа 1 - 2.28% испытуемых).

 

Таблица 3.

 

Номер группы 1 2 3 4 5
Границы группы от -¥ до Мх-2s от Мх-2s до Мх-s от Мх-s до Мх+s от Мх-s до Мх-2s от Мх+2s до +¥
Z-показатель -¥ ¸-2 -2 ¸ -1 -1 ¸ +1 +1 ¸ +2  +2 ¸ ¥
Процент испытуемых в группе 2.28 13.59 68.26 13.59 2.28
Правая граница в процентилях 2.28 15.87 84.13 97.72 100.00

 

Результатом стандартизации являются таблицы пересчета “сырых” оценок в стандартные, где указываются границы групп в тех единицах, в которых непосредственно проводились тестовые измерения. Например, по некоторой методике оценивается скорость реакции водителя, результат представляется в баллах. В исследованной выборке Мх составляет 80, а стандартное отклонение равно 12. Границы выделенных групп получаются равными 56, 68, 92, 104 (Таблица 4).

 

Таблица 4.

 

Номер группы 1 2 3 4 5
Интерпретация результата Низкий Ниже среднего Средний Выше среднего Высокий
Принцип отнесения в группу (если испытуемый набирает ... баллов) <56 56-67 68-92 93-104 >104

 

В дальнейшем, при использовании методики, испытуемый набирает, к примеру, 95 баллов, и, глядя на таблицу, мы сразу же относим результат к группе “выше среднего”. При необходимости можно рассчитать Z-оценку испытуемого Z=(95-80)/10=1.5 и по таблице нормального распределения определить, что хуже него выполняют тест примерно 93.3% испытуемых, а лучше - лишь 6.7%.

Один из недостатков Z-шкалы - наличие отрицательных и дробных Z-показателей, что неудобно в работе. Для удобства Z-шкалу преобразуют по формуле y=az+b, где у - оценки новой шкалы, а и b - назначаемые новые стандартное отклонение и среднее. Наиболее популярна Т-шкала Мак-Колла, где а=10, b=50. Для перехода к Т-шкале надо рассчитать Z-оценки и перевести их в Т-шкалу по формуле T=10z+50. По этой шкале среднее арифметическое равно 50, границы групп 30, 40, 60, 70.

Используется также шкала Векслера, коэффициенты a и b в которой равны соответственно 15 и 100: IQ=15z+100. Кроме того, известна шкала Амтхауэра A=10z+100.

Другой недостаток шкалы Z-оценок и производных от нее шкал - то, что получается очень большое количество средних значений, а в крайние группы попадают совсем немногие испытуемые. Чтобы избежать этого недостатка, увеличивают число групп (шкалы стенов, станайнов, квантильные шкалы).

Название шкалы стенов происходит от английского словосочетания “standard ten” - стандартная десятка. По данной шкале выборка делится на 10 групп испытуемых, которым присваиваются баллы от 1 до 10. Среднее арифметическое принимается равным 5.5, стандартное отклонение примерно равно 2. Формула перехода к шкале стенов St=2z+5.5. Ось Х делится на интервалы, равные 0.5s. С учетом приведенных среднего арифметического и s можно рассчитать процент испытуемых, попадающий в каждую группу:

Таблица 5.

 

Стен 1 2 3 4 5 6 7 8 9 10
Процент испытуемых в группе 2.28 4.40 9.19 14.98 19.15 19.15 14.98 9.19 4.40 2.28
Правая граница группы в процентилях 2.28 6.68 15.87 30.85 50.0 69.15 84.13 93.32 97.72 100

 

Шкала станайнов (“стандартной девятки) по своей идее близка к шкале стенов. В целом, она строится аналогично шкале стенов, но взято число групп 9, чтобы избежать появления двузначных цифр (это удобно при машинной обработке данных).

Наряду со шкалой z-оценок и производных от нее шкал используются квантильные шкалы. Квантильная шкала получается путем разбиения выборки на равные по количеству испытуемых части. Чаще используется деление на 5 или 10 частей, то есть в выборке определяются квинтили или децили. В этом случае границы групп в долях сигмы можно подобрать по таблицам нормального распределения (Таблица 1 Приложения). При использовании квантильных шкал ось Х делится на части, равные по количеству испытуемых, но непропорциональные величине стандартного отклонения.

 

СТАТИСТИЧЕСКИЕ ГИПОТЕЗЫ

 

Гипотезой называется предположение, имеющее вероятностный характер, обладающее неопределенностью в отношении своей истинности. Гипотезы формулируются для того, чтобы представить в четком, лаконичном виде представления автора о том или ином факте, о его причинах.

В статистике гипотезы формулируются по поводу характеристик распределений, частот событий, положения событий относительно друг друга в ранжированном порядке и так далее. Подход к гипотезе в статистике четкий и в значительной мере формальный. Принято выделять статистические гипотезы двух основных видов - нулевую и альтернативную. Нулевая гипотеза, обозначаемая Н0, формулируется как гипотеза об отсутствии отличий: о сходстве двух распределений, о равенстве средних арифметических двух выборок и т.п. Нулевой она называется потому, что содержит 0: Х12=0, где Х1 и Х2 - значения признаков. Нулевая гипотеза утверждает, к примеру, что результаты выполнения задания экспериментальной группой и контрольной не различаются. Альтернативная гипотеза Н1 противоположна по смыслу нулевой, она утверждает наличие отличий в выборках, в параметрах их распределений и так далее (результаты экспериментальной группы значимо отличаются от результатов контрольной группы).

Две гипотезы - нулевая и альтернативная - образуют группу несовместных событий, то есть, если принимается одна из них, то другая отклоняется: принимая гипотезу об отсутствии различий Н0, мы отклоняем альтернативную гипотезу Н1, утверждающую, что различия есть, и, соответственно, наоборот.

Кроме этого, статистическая гипотеза может быть направленной или ненаправленной. Ненаправленная гипотеза фиксирует только наличие или отсутствие различий:

Н1 - ненаправленная альтернативная гипотеза: результаты экспериментальной группы значимо отличаются от контрольной,

Н0 - ненаправленная нулевая гипотеза: результаты экспериментальной группы значимо не отличаются от контрольной.

Направленная гипотеза говорит о наличии или отсутствии различий в определенном направлении:

Н1 - направленная альтернативная гипотеза: результаты экспериментальной группы выше (или, наоборот, ниже) результатов контрольной группы,

Н0 - направленная нулевая гипотеза: результаты экспериментальной группы не превышают результаты контрольной.

Общая схема классификации гипотез представляется в следующем виде:

Проверка гипотез производится с помощью статистических критериев. Статистический критерий - это правило, которое позволяет принимать истинную и отклонять ложную гипотезу с высокой степенью вероятности. Математически критерий представляет собой формулу, по которой мы рассчитываем некоторое число. Есть много разных видов статистических критериев, каждый из них разработан для решения определенного круга задач: так, по одному из них можно доказывать значимость различий средних арифметических значений двух выборок, по другому - согласованность изменения параметров двух распределений и так далее. Как правило, по формуле рассчитывается числовое значение критерия для имеющейся в нашем распоряжении выборки данных (полученное число называется эмпирическим значением критерия), и эмпирическое значение сравнивается с критическими значениями критерия, приведенными в таблицах. Различие между эмпирическим и критическим значениями критерия позволяет нам принять одну из статистических гипотез (нулевую или альтернативную) и отклонить другую.

Все статистические критерии делятся на параметрические и непараметрические. Параметрическими называются критерии, в формулу расчета которых входят параметры распределения (чаще всего это среднее арифметическое и стандартное отклонение). Непараметрические критерии, соответственно, параметры распределение в формулу расчета не включают, они оперируют только частотами или рангами. Каждая группа критериев имеет свои возможности, свои преимущества и недостатки, свои ограничения в использовании, которые будут рассмотрены при описании каждого из критериев. Параметрические методы следует применять при достаточно больших выборках (на практике обычно это означает больше 15 - 20 испытуемых), когда исследуемое распределение относится к нормальному типу. При небольшом количестве испытуемых, а также, если исследуемое распределение значимо отличается от нормального, следует воспользоваться непараметрическими методами. Непараметрические методы в психологии используются весьма широко, поскольку набрать достаточное количество испытуемых представляется возможным далеко не всегда.

В статистике за основной вариант принимается вариант рассмотрения истинности нулевой и ложности альтернативной гипотезы в генеральной совокупности. На практике это означает, что различия считаются незначимыми до тех пор, пока не доказано обраьное с высокой степенью вероятности. Применяя определенный критерий для принятия той или иной гипотезы по результатам обследования выборки, исследователь оказывается в следующей ситуации:

 

Таблица 6.

Действия

Состояние нулевой гипотезы

исследователя Истинное Ложное
Принимается Н0 Принято правильное решение (р=1-a) Совершена ошибка 2-го рода (р= b)
Отклоняется Н0 Совершена ошибка 1-го рода (р=a) Принято правильное решение (р= 1-b)

 

Такая ситуация складывается потому, что исследование проводится на выборке, а вывод делается об истинности гипотезы в генеральной совокупности. Понятно, что пока не изучена вся генеральная совокупность, нельзя дать окончательный ответ, а можно говорить лишь о большей вероятности одной гипотезы и меньшей другой и при этом указывать вероятность ошибки сделанного вывода.

Например, все признаки свидетельствуют о том, что должен пойти дождь. Нулевая гипотеза говорит нам об отсутствии различий между характеристикой сегодняшней погоды и характеристикой дождливого дня (низкое давление, низкая плотная облачность, высокая влажность). Альтернативная гипотеза утверждает, что различия есть, следовательно, дождя не будет.

Таблица 7.

          

В действительности

Действия Н0: дождь будет Н1: дождя не будет
Брать зонт Правильное решение (1-a) Ошибка 2-го рода (b)
Не брать зонт Ошибка 1-го рода (a) Правильное решение (1-b)

 

Как видно из таблицы, ошибка первого рода состоит в том, что мы отклонили нулевую гипотезу, которая на самом деле верна. Вероятность ошибки 1-го рода обозначается a, соответственно вероятность правильного решения будет 1-a. Вероятность 1-a называется доверительной вероятностью. В каждом исследовании должна быть указана вероятность ошибки 1-го рода a (либодоверительная вероятность 1-a) в виде десятичной дроби (a=0.05), или в процентах (a=5%)

Ошибкой второго рода называется принятие по результатам выборочного исследования нулевой гипотезы, в то время как верна альтернативная. Обозначается вероятность ошибки второго рода b, соответственно, вероятность правильного решения в данном случае 1-b. Вероятность 1-b называется мощностью критерия. Мощность критерия характеризует его способность отклонять ложную гипотезу.

Вероятность ошибки первого рода a исследователь задает самостоятельно, либо ее можно рассчитать. Вероятность ошибки второго рода b обычно остается неизвестной, только в некоторых случаях она может быть оценена примерно. Оба вида ошибок тесно связаны между собой: если отклоняется истинная нулевая гипотеза, то принимается ложная альтернативная, или, если принимается ложная нулевая гипотеза, то отклоняется истинная альтернативная. Задавая низкий уровень вероятности ошибки a, мы тем самым резко увеличиваем вероятность ошибки второго рода b,и наоборот, повышая вероятность ошибки a,мы уменьшаемвероятность ошибки b. В каждом конкретном случае следует проанализировать, какая из ошибок несет в себе меньшую опасность, и после этого задать тот или иной уровень доверительной вероятности. При использовании статистических методов в психологии обычно ориентируются на вероятность a = 0.05 (доверительная вероятность 95%, то есть ошибка вероятна лишь в одном случае из 20), считая ее пограничной для принятия или отклонения альтернативной гипотезы. Если требуется принять альтернативную гипотезу с большей степенью надежности, то принимается a = 0.01 (доверительная вероятность 99%). Но если же надо обеспечить высокую степень надежности нулевой гипотезы, то есть с малую вероятность ошибки второго рода b,тоэто можно сделать, повышая вероятность ошибки первого рода a до значений 0.10, 0.20 или даже 0.50 (доверительная вероятность соответственно 90, 80 и 50%). Например, для ситуации с зонтом, как правило, более безболезненно пройдет ошибка второго рода b- зонт возьмем, а дождя не случится.


Дата добавления: 2018-05-12; просмотров: 1429; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!