Инкрементная и дифференциальная валидность



(incremental and differential validity)

 

Эти два термина (обсуждавшиеся у Vernon, 1950) заслуживают краткого упоминания. Инкрементная валидность относится к случаю, когда один тест из батареи тестов может иметь низкую корреляцию с критерием, но не перекрываться другими тестами из этой батареи. Тогда этот тест имеет инкрементную валидность для отбора в соответствии с данным критерием. Это может быть полезным в психологических испытаниях при профотборе.

Дифференциальная валидность хорошо иллюстрируется тестами интересов. Эти тесты умеренно коррелируют с общей университетской успеваемостью, но по-разному для разных дисциплин. Таким образом, можно сказать, что они обладают дифференциальной валидностью для академической успеваемости. Тесты IQ, с другой стороны, имеют более высокие корреляции с принятыми в университетах учеными степенями, но не могут дифференцировать по отдельным дисциплинам.

Подводя итог, можно сказать, что инкрементная и дифференциальная валидность являются полезными показателями эффективности для тех тестов, которые предстоит использовать в процедурах отбора.

 

Содержательная валидность (content validity) (от англ. increment - прибыль, прирост)

Этот термин применяется, в основном, по отношению к тестам достижений и может быть просто объяснен следующим образом. Если можно показать, что задания теста отражают все аспекты исследуемой области поведения, то тест является, по существу, валидным, при условии, что инструкции изложены ясно. Содержательная валидность не сводится к простой очевидной валидности, которая связана с внешним видом заданий теста. Если в тесте математических навыков мы хотим протестировать умение перемножать выражения в скобках и имеем задания вида (3H-2fc)(2-3х)=?, то трудно оспаривать валидность этого задания. Очевидно, содержательная валидность полезна только для тех тестов, для которых, как в данном случае, смысл измеряемого параметра полностью ясен.

 

Конструктная валидность (construct validity)

 

Понятие конструктной валидности впервые было введено Cronbach и Meehl (1955). Чтобы продемонстрировать конструктную валидность теста, необходимо настолько полно, насколько это возможно, описать переменную (конструкт), для измерения которой предназначен тест. Это достигается формулированием гипотез о результатах теста в свете всего того, что известно об этой переменной.

Таким образом, конструктная валидность включает в себя все подходы к определению валидности, перечисленные выше.

Понятие конструктной валидности можно, вероятно, лучше всего пояснить на следующем примере. Ниже я формулирую гипотезы, подлежащие проверке при установлении конструктной валидности теста оральных черт личности - The Oral Pessimism Questionnaire (OPQ) (оральные по З. Фрейду черты личности: ненасытность, жадность, требовательность, неудовлетворённость всем предлагаемым. Уже на оральной стадии, согласно его представлениям, люди делятся на оптимистов и пессимистов), разработанного автором (Kline, 1978).

(1) OPQ будет коррелировать положительно, но умеренно (ввиду их невысокой эффективности) с другими тестами, направленными на выявление оральных черт личности.

(2) Из описания синдрома «орального пессимизма» должна наблюдаться умеренная корреляция с нейротизмом.

(3) Поскольку 16-факторный личностный опросник Кэттелла не предназначен для измерения параметров, подобных данному синдрому, то с этим опросником не должно быть никаких корреляций.

(4) Поскольку OPQ является личностным тестом, не должно быть значимых корреляций с переменными способностей или мотивов.

Отметим, что последняя гипотеза иллюстрирует необходимость показывать, при исследовании конструктной валидности, чего тест не измеряет, наряду с тем, что он измеряет.

Если все эти гипотезы получат подтверждение их истинности, тогда все же может показаться спорным, что продемонстрирована конструктная валидность теста OPQ как средства измерения совокупности личностных черт, определяемых как «оральный пессимизм». Дальнейший, более непосредственный способ продемонстрировать валидность теста может состоять в формулировании пятой гипотезы, а именно, что испытуемые, имеющие высокую выраженность измеряемых черт личности, покажут по OPQ более высокие показатели, чем те, у которых она низкая.

Таким образом, конструктная валидность - это мощный метод демонстрации валидности тестов, для которых установление единственного критерия их обоснованности является затруднительным.

Вместо одного результата мы должны учитывать одновременно множество результатов.

С конструктной валидностью связана одна проблема, которую следует упомянуть. Речь идет об элементах субъективности, вовлекаемых в интерпретацию результатов по изучению конструктной валидности. В этом случае (как это обычно и случается на практике), когда эти результаты недостаточно однозначны, многое зависит от мастерства, уровня развития интерпретативных навыков разработчика тестов.

Заключение

Были описаны разнообразные способы установления валидности тестов; некоторые из них коренным образом отличаются друг от друга. Так, конструктная валидность тесно связана с нашим определением валидного теста как теста, измеряющего то, для измерения чего он предназначен. Это, вероятно, наиболее важный аспект валидности, особенно, если тесты должны использоваться для расширения области психологических знаний. С помощью дифференциальной валидности устанавливается обоснованность теста для некоторых частных случаев. Это иное использование термина «валидность», которое отражает особенности его использования. Однако, в практических приложениях тестов этот аспект валидности чрезвычайно важен.

Из обсуждения должно быть также понятно, что не может быть какого-либо единственного показателя, демонстрирующего валидность теста. Для полной ее проверки следует учитывать множество получаемых показателей. Несмотря на это, для многих тестов (хотя это лишь небольшая часть из общего их количества) была показана высокая валидность и концептуальная, как в случае конструктной валидности, и для практических целей. Более того, как это станет ясно из дальнейшего изложения, валидность теста может фактически гарантироваться логически обоснованными методами конструирования тестов.

 

Дискриминативность

 

Еще одной особенностью эффективных тестов является дискриминативность. Действительно, достижение удовлетворительного распределения показателей является одной из целей разработчика теста. Нет необходимости подчеркивать то, что является очевидным: какова ценность психологического теста, по которому все испытуемые показали одинаковые результаты? При помощи тщательного конструирования теста можно обеспечить соответствующий уровень дискриминативности, а это именно то, в чем тесты значительно выигрывают по сравнению с другими формами испытаний. В общем, было обнаружено, что в оценке может быть использовано около девяти градаций (см. Vernon, 1950), а в опросах, вероятно, наиболее эффективно использовать три градации: нижесреднего, средний уровень и выше среднего. Подобно этому, шкалы ранжирования редко содержат более девяти градаций. Это означает, что испытуемые разбиваются в лучшем случае на девять групп. Это проявляется как недостаток по сравнению с психометрическим тестом, в котором показатели могут иметь крайне широкий разброс и могут давать эффективно обрабатываемые значения стандартных показателей от 20 до 80, с крайними показателями некоторых испытуемых, выходящими за эти пределы. Дискриминативность измеряется показателем дельта Фергюсона и принимает максимальное значение при равномерном (прямоугольном) распределении показателей. Прежде, чем завершить обсуждение надежности, валидности и дискриминативности, я кратко опишу модель измерения, в неявном виде подразумевавшуюся во всей предыдущей дискуссии. Даже беглое знакомство с этой моделью прольет свет на внутреннюю природу конструирования тестов. Она также обеспечивает обоснованную статистическую базу для вычислений и процедур конструирования тестов, рассматриваемых в данной книге.

 


Дата добавления: 2018-02-18; просмотров: 1546; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!