Психометрические характеристики психодиагностических методов.



Психометрия / психометрика (побукв. «душа», «мера») – область психологии, связанная с теорией и практикой измерения психических явлений. Понятие психометрии введено в 1734 г. Христианом Вольфом, впервые указавшим на возможность измерения в психологии. Одним из первых измерений в психологии было измерение времени реакции, поэтому первоначально под психометрией понималось измерение временных характеристик психических процессов. Впоследствии по мере развития психологического эксперимента, строящегося по образцу и подобию естественных наук, к психометрии начинают относить все то, что связано с количественным определением психических явлений. В настоящее время психометрия включает в себя весь спектр психологических измерений – от психофизических до личностных. Создание любого психологического инструмента измерения требует соблюдения определенных требований. Эти требования касаются точности, достоверности и адекватности методики измерения, сопоставимости получаемых с ее помощью результатов. Соответствие этим требованиям устанавливается путем применения специальных математико-статистических процедур, совершенствование и разработка которых, прежде всего, связаны с конструированием психологических тестов. Таким образом, во многом благодаря развитию тестирования в 20-30-е годы XXвека формируется особая область психометрии, которая имеет дело с индивидуальными психологическими различиями в психодиагностике – психометрия дифференциальная. К основным психометрическим свойствам теста относятся валидность, надежность. Также проблемным является вопрос о репрезентативности норм и стандартизации теста. Репрезентативность норм. Стандартизация.

 

Нормы – показатели для различных групп испытуемых, полученных при стандартизации теста. Репрезентативность норм – соответствие тестовых норм стандартизации тестовым нормам той популяции, на которой применяется тест. Стандартизация теста, в свою очередь, представляет собой процедуру унификации, регламентации, приведения к единым нормативам процедуры и оценок теста. Благодаря стандартизации методики достигается сопоставимость полученных результатов у разных испытуемых, появляется возможность выражения тестовых оценок в относительных к выборке стандартизированных показателях, сопоставление таких оценок в разных методиках.

В психодиагностике следует различать две формы стандартизации: 1) стандартизацию самой процедуры проведения инструкций, бланков, способа регистрации, условий и т.п. Без стандартизации теста невозможно получить нормативное распределение тестовых баллов и, следовательно, тестовых норм; 2) стандартизацию шкалы, т.е. линейное преобразование масштаба нормальной (или искусственно) нормализованной шкалы. Смысл преобразований исходных тестовых оценок заключается в изменении характера их распределения, с тем, чтобы облегчить понимание и интерпретацию тестовых результатов. Например, через вычисление процентилей.

 

Процентиль - % испытуемых, результат которых ниже определенной первичной оценки (тот конкретный балл, который испытуемый получает за тест). Алгоритм вычисления: 1) упорядочивание сырых баллов (по возрастанию или по убыванию); 2) частота встречаемости конкретных баллов; 3) вычисление накопленных частот (группировка в определенный интервал);

4) вычисление процентилий.

Достоинства: 1) легко вычисляются; 2) подходят для любого теста. Недостатки: неравные единицы измерения. Чаще всего используются три основных вида преобразований: 1) приведение к нормальному виду; 2) приведение к стандартной форме; 3) квантильная стандартизация.

 

Преобразование распределения тестовых оценок к нормальному виду. Стандартизация психодиагностических тестов основана на так называемой аксиоме нормальности, т. е. опирается на предположение, что все психические характеристики распределены в популяции по нормальному закону Гаусса. При таком распределении большая часть значений группируется около некоторого среднего значения, по обе стороны от которого частота наблюдений равномерно снижается. Нормальное распределение имеет вид симметричной колоколообразной кривой, которая растянута до бесконечности в положительном и отрицательном направлениях. Если визуальное сравнение реальной гистограммы с кривой нормального распределения кажется недостаточным, можно применить тест Колмогорова-Смирнова.

2 основные характеристики: 1) среднее арифметическое = математическое ожидание (средний балл); 2) дисперсия = сумма отклонений значений испытуемых от среднего. Интерпретация тестовых оценок невозможна без знания того, к какой кривой распределения они принадлежат, т.е. для того, чтобы оценить величину тестовой оценки и частоту ее реализации, необходимо соотнести их с генеральной средней и стандартным отклонением. Без этого исходные тестовые оценки ничего не скажут нам о степени выраженности исследуемой характеристики и о вероятности появления такого ее значения у других лиц. Предположение о нормальности распределения тестовых результатов является некоторой идеализацией. На практике многие тесты дают результаты, распределение которых отличается от нормального. Поэтому часто возникает вспомогательная задача нахождения способа преобразования данных к нормальному виду. В самом начале поиска способа преобразования большую помощь может оказать построение гистограммы и полигона распределения. Они позволяют легко выявить лево- или правостороннюю асимметрию, двугорбость и другие отклонения от нормальности. Таким образом, удается преобразовать тестовые оценки, не подчиняющиеся закону нормального распределения, чтобы распределение новых, преобразованных оценок стало нормальным.

 

Таким образом, к недостаткам исходных тестовых оценок можно отнести: 1) по исходным оценкам мы можем судить только о том: чем выше оценка, тем больше выражена соответствующая характеристика, но о том, какова она по отношению к среднему значению этого свойства в популяции, мы ничего сказать не можем. 2) невозможность сопоставления результатов, полученных с помощью разных тестов. Как правило, разные тесты имеют различные средние показатели и стандартные отклонения, поэтому их результаты имеют различную размерность. Чтобы сделать возможным сопоставление результатов и устранить различия в размерности, необходимо тестовые оценки нормировать, введя единый для всех оценок масштаб. С этой целью максимум фактической кривой распределения совмещается с осью ординат. Эта операция называется центрированием случайной величины и выполняется путем вычитания из исходной тестовой оценки ее среднего значения. Так, на практике психолог-исследователь может рассчитывать параметры любого распределения, если единицы, которые он использовал при измерении, признаются разумными в научном сообществе. Понятие надежности. Виды надежности. Надежность можно рассматривать как характеристику методики, отражающую точность психодиагностических измерений, а также устойчивость результатов к действию посторонних случайных факторов. Так, ее можно определить в качестве внутренней согласованности и устойчивости по прошествии времени. Дисперсия результатов (разброс): самого измеряемого свойства; нестабильность процедуры измерения; влияние исследуемой выборки: а) репрезентативность выборки (описание выборки стандартизацией); б) надежность определяется на однородной выборке (схожесть); в) для каждой выборки свои коэффициенты надежности.

 

Существуют следующие виды надежности: параллельных форм – характеристика надежности психодиагностической методики с помощью взаимозаменяемых форм теста, предъявляемых одной и той же группе испытуемых; ретестовая надежность – характеристика надежности психодиагностической методики при повторном исследовании испытуемых с помощью одного и того же теста по прошествии времени. Способом ее измерения является корреляция показателей для выборки испытуемых, протестированных в двух случаях. Наименьшим удовлетворительным значением ретестовой надежности является 0,7; - частей теста - надежность психодиагностической методики, получаемая путем анализа устойчивости результатов отдельных совокупностей тестовых задач или отдельных заданий теста. Следует особо отметить значение и важность надежности по внутренней согласованности. Ведь для того, чтобы тест был валидным, он должен быть согласованным. Так, общепринятая в психометрии точка зрения состоит в том, что высокая надежность является предпосылкой валидности. Единственным, кто подвергает данное положение сомнению, является Кэттелл. Он аргументирует это тем, что высокая внутренняя согласованность в действительности является противоположностью валидности на том основании, что каждый вопрос должен затрагивать меньшую область или иметь более узкое значение, чем критерий, подвергающийся измерению. Несмотря на эти комментарии, общее психометрическое правило гласит: на практике валидные тесты являются в высокой степени согласованными. Гомогенность теста свидетельствует о том, что все задания теста устойчиво измеряют одну и ту же психологическую характеристику. Это означает, что если испытуемые имеют одинаковые тестовые оценки, то и степень выраженности у них измеряемого качества одинакова. Таким образом, гомогенность теста — обязательное условие того, чтобы результаты измерения имели однозначную трактовку: в случае негомогенного теста один и те же оценки у разных испытуемых допускают различное объяснение.

 

Коэффициент надежности = коэффициент корреляции между двумя замерами (больше 0,8). Понятие валидности. Виды валидности. Классическим определением валидности в психометрической литературе является определение Анны Анастази: «валидность теста – понятие, относящееся к тому, что тест измеряет и насколько хорошо он это делает». Инвалидные, т.е. не обладающие валидностью, тесты, не пригодны для практического использования. Следовательно, валидность является комплексной характеристикой теста, включающей сведения об области исследуемых явлений и репрезентативности исследуемой по отношению к ней диагностической процедуры. В психометрической литературе выделенные виды валидности рознятся. Несмотря на их многообразие, существуют основные виды валидности: 1) дифференциальная валидность = валидность, которая рассматривает внутренние взаимоотношения между психологическими факторами, диагностируемыми с помощью методики (при профотборе); 2) инкрементная (инкремент = приращение, прибыль) валидность = вид критериальной валидности, которая отражает практическую ценность методики при проведении отбора. Показатель указывает на роль теста в улучшении отбора лиц для реальной деятельности, степень результативности (отбор, профотбор); 3) консенсусная валидность = вид валидности, который основан на установлении связей тестовых данных с данными, полученными от внешних экспертов, хорошо знакомых с лицами, которых диагностируют. 4) конструктная или внутренняя валидность. Психологический конструкт = теоретическая идея, разработанная для объяснения и организации существующего знания. Отражает степень репрезентации исследуемого психологического конструкта в результатах теста. Процедура установления сложна (постепенное накапливание знаний, информации о динамике развития измеряемого свойства и о его взаимодействия с другими явлениями). Метод измерения сопоставление результатов теста с другими методиками, конструктивное содержание которых уже известно. Слишком высокие корреляции нельзя, т.к. в этом случае может быть дублирование или создание параллельных форм. Установление, как сходств, так и различий психологических признаков (смысл процедуры): конвергентная проверка степени близости прямой или обратной связи; дискриминантная установление отсутствия. Достоинства: возможно, обновление.

5) очевидная валидность или доверительная. Представления о тесте, сфере его применения, результативности и прогностической ценности, которая возникает у испытуемого, лица, который не имеет сведений о цели, характере испытания. Возрастает, следовательно, повышает мотивацию испытуемых к исследованию. Для исследования взрослых людей. Играет роль степень сложности методики. Следует избегать помещения на бланках необоснованно общих названий (нейтральное лучше). Возможно, возникновение критерия контаминации комплекс явлений, связанных с влиянием информации о результатах исследования испытуемого на субъективное отношение к исследуемому респонденту со стороны других лиц. Тем более выражен, чем большей валидностью обладает методика. В.А. Аванесов приводит пример отказа от выполнения теста испытуемыми из-за отсутствия у теста очевидной валидности. Во время одного социологического опроса моряков рыболовного флота он столкнулся со случаем отказа заполнять анкету под предлогом того, что анкета составлена «не для моряков», в ней нет вопросов, относящихся к морякам, «на морские темы». Если бы опросник содержал «морские термины», то он бы казался «своим» и вызывал больше доверия у испытуемых. Именно в силу этого обстоятельства очевидную валидность иногда называет также доверительной валидностью. Таким образом, данный вид валидности лишь помогает добиться сотрудничества с испытуемыми. 6) Содержательная или логическая валидность. Характеризует степень репрезентативности содержания заданий теста области измеряемых свойств. Закладывается в тест уже при наборе заданий. Этапы закладки: 1) определение групп исследуемых свойств, расчленение на элементы; 2) разработка модели тестовой деятельности на основе реальной; 3) анализ степени соответствия разработанной модели реальной через обращение к экспертам; 7) критериальная валидность или валидность по критерию связь показателей методики с внешним критерием показатель полезности. Включает в себя: прогностическую валидность или информационную показатель того, с какой степенью достоверности, точности методика позволяет судить о свойстве спустя некоторое время. Анастази: предсказательная валидность. Сведения имеют отношение к возможности экстраполирования результатов на будущее. Определяется по надежному внешнему критерию (показатели актуального поведения, ожидаемые результаты деятельности, учения, образования); текущая валидность или конкурентная, или валидность по одновременности. Характеристика, которая отражает способность теста различать испытуемых на основе диагностического признака, являющегося объектом исследования в момент проведения методики. Определяется с помощью внешнего критерия (успеваемость на настоящее время, производительность труда). Эта валидность измеряется корреляцией результатов данного теста с измерениями при помощи других тестов, предназначенных для измерения той же самой переменной. Конкурентная валидность полезна тогда, когда есть неудовлетворительно работающие тесты для измерения некоторых переменных, а новые тесты создаются в попытке улучшить качество измерения. Конкурентная валидность также полезна для установления факта, чего же не измеряет тест.- ретроспективная валидность. Определяется на основе критерия отраженного события или состояния качества в прошедшем времени (сопоставимость прошедшей оценки); 8) экологическая валидность по отношению к измеряемому свойству в контексте определенной ситуации. Связана с проблемой влияния ситуации на результаты тестирования. Возможна, переносимость теста в разные ситуации.

 

2 класса валидности (как процесс): теоретическое отношение к самой методике как к измерительному инструменту (само психологическое свойство). Поиск самого конструкта, следовательно, критерий найти сложнее; прагматическая относится к цели использования методики (независимый внешний критерий, и с ним сравниваются результаты методики).

 

Исторический аспект. Методика валидна, когда: 1) когда то, что она измеряет, очевидно; 2) когда теория, на основе которой она строилась, очень характерная. Критерий валидизации = мера психического свойства, на исследование которого направлена психодиагностическая методика. В качестве критерия валидизации выступают: объективные, социально демографические, биографические данные (стаж, образование, профессия); показатели школьной учебной успеваемости (тесты на интеллект); производственные показатели эффективности выполнения отдельных видов деятельности (профотбор, профориентация); результаты реальной деятельности (рисование, моделирование, музыка; тесты специальных и общих способностей, личности); врачебный диагноз (клиническая психология); контролирование знаний и умений испытуемых, данных других методик или тестов, валидность которых считается уже установленной.

 

Характеристика критериев: объективные; субъективные (оценки, суждения экспертов). Увеличение количества экспертов (контент анализ).

 

4 метода проведения процедуры валидизации:1) коллективная оценка (оценочная шкала, условие выработки общее компромиссное решение; 2) метод средней взвешенной оценки (каждый испытуемый оценивается несколькими экспертами, результаты усредняются); 3) ранжирование (распределяют членов выборки по шкале); 4) метод парного сравнения (попарная расстановка по альтернативным признакам.

 

Выбор критерия валидизации очень важный и ответственный этап. Чем более сложное психическое явление, тем критерий должен быть шире. Соотношение понятий «валидность» и «надежность». Сразу можно отметить тот факт, что это связанные понятия. Валидность (или обоснованность) всякой процедуры измерения состоит в однозначности (устойчивости) получаемых результатов относительно измеряемых свойств объектов, т.е. относительно предметов измерения. Надежность – это устойчивость процедуры относительно объектов. Надежность не обязательно предполагает валидность. Устойчивость теста относительно объектов (испытуемых) является необходимым, но недостаточным условием его устойчивости относительно измеряемых атрибутов (свойств) объектов. Основное соотношение психометрики: ВАЛИДНОСТЬ ≤ НАДЕЖНОСТЬ. Это означает, что валидность теста не может превышать его надежность. Данное соотношение, однако, неверно трактовать как указание на прямую пропорциональную связь валидности и надежности. Например, для расширения области применения теста (содержательная валидность) психодиагность должен избегать излишнего повышения внутренней согласованности. Она может быть предельна, а валидность минимальна. Требования к психометрической подготовке психолога. Для эффективного развития практической психодиагностики сегодня требуется резкое повышение психометрической культуры всех психологов, использующих измерительные психодиагностические методики.

 

Требования к психологу: 1) уметь квалифицированно разбираться с психометрической документацией в методической литературе по психодиагностике; 2) определить, в какой мере известные тестовые нормы по требующей методике применимы в его ситуации с учетов контингента испытуемых и типа диагностической ситуации, существует ли ситуация «внутрикультурного переноса» и нужна ли рестандартизация тестовых норм; 3) самостоятельно собирать данные, проводить обработку и измерять эмпирическую валидность (эффективность методики по отношению к заданному критерию); 4) самостоятельно определять появление слишком высокой погрешности в результатах, утрату методикой необходимого уровня надежности, при этом проверять свою гипотезу статистически; 5) обязан вести двойную документацию (должен быть готов предать все копии протоколов в головную методическую организацию для пополнения общего банка данных и совершенствования психометрических характеристик методики), а также тщательно соблюдать заданные методические стандарты; 6) самостоятельно выявлять и измерять уровень мотивационных искажений, обусловливающих фальсификацию тестовых данных испытуемыми; 7) овладевать приемами количественного подсчета тестовых показателей.

 

Требования к психологу-психометристу: 1) самостоятельно планировать и осуществлять все этапы по психометрическому конструированию или адаптации психодиагностических методик; 2) организовывать хранение и обработку психодиагностических данных на компьютере; 3) организовывать работу психологов-психодиагностов по ведению документации к используемым методикам, по соблюдению методических стандартов и т.д.; 4) вести картотеку методик.

 


Дата добавления: 2019-07-15; просмотров: 2284; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!