Глава 4. Создание надежных тестов III: конструирование тестов других типов

⇐ ПредыдущаяСтр 11 из 16Следующая ⇒

В этой главе будет обсуждаться разработка заданий и подбор ма-

териала для других типов психологических тестов. Многое из того,

что уже обсуждалось, особенно в предыдущей главе, применимо и

здесь, а поэтому не будет упоминаться вновь. Основное внимание

будет уделено приемам, специфичным для конструирования объек-

тивных тестов личности или темперамента, проективных тестов, ин-

струментов измерения настроения и интересов и, наконец, шкалам

аттитюдов. Начнем с объективных тестов.

Объективные тесты

Определение

Определение, используемое здесь, принадлежит Кэттеллу и его

коллегам (напр., Cattell, 1957). Объективный тест - это тест, цель

которого скрыта от испытуемого (а поэтому результаты не могут быть

фальсифицированы), и данные, полученные с его помощью, могут

быть оценены независимо от лица, проводящего тестирование и ин-

терпретацию. Преимущество таких тестов состоит в их практическом

значении. Когда испытуемые не могут произвольно манипулировать

показателями, такой тест может быть использован в процедурах

профотбора. Это означает, что на протяжении многих лет может быть

накоплено огромное количество подлинно жизненных критериаль-

ных данных о соответствии между профессиональными успехами и

переменными объективных тестов. Кроме того, отсутствие возмож-

ности произвольного искажения результатов полезно и в тех обла-

стях, в которых предъявляются менее жесткие требования, таких как

профориентация и психиатрия. Однако и в случае объективных тес-

тов мы не можем быть уверены, что испытуемые не будут искажать

их результаты.

В объективных тестах произвольная фальсификация все же воз-

можна. Так, в тесте «Slow Line-Drawing Test» испытуемые могут

чертить линии не так плавно, как они в состоянии это делать. Однако,

они не знают, ни как это скажется на их показателях, ни даже самих

показателей. Подобное неповиновение инструкциям само по себе

симптоматично для определенных черт личности, и на деле может

быть использовано как переменная объективного теста.

Последнее предложение дает нам ключ к разрешению основной и

имеющей глубокие корни проблемы конструирования объективных

тестов. В соответствии с нашим определением, почти любое задание,

которое может быть объективно оценено и не является непосредст-

венной реакцией на вопрос (как в тестах личности), может быть

объективным тестом. Например, данную страницу рукописи можно

использовать для получения следующих объективно тестируемых

переменных:

(1) Продолжительность времени написания.

(2) Количество слов на странице.

(3) Количество существительных.

(4) Количество глаголов.

(5) Количество зачеркиваний.

(6) Давление пера при письме.

(7) Количество имен собственных.

Конечно же, психологическое значение таких переменных неиз-

вестно - это вторая проблема, связанная с объективными тестами.

Следовательно, в процессе создания объективных тестов нам пред-

стоит решить и эту проблему. На каком основании мы можем отби-

рать объективные тесты (которых, по определению, может быть

очень много), чтобы хоть в какой-то мере надеяться на то, что они

валидны? Если тест является очевидно валидным, то он уже не явля-

ется объективным, так как может быть угадана его цель. Следова-

тельно, нам необходимы некие общие принципы для конструирова-

ния объективных тестов - таксономия объективных тестов.

Преимущества объективных тестов

При наличии упомянутых выше проблем, возникающих при раз-

работке объективных тестов, вполне резонно спросить, стоит ли пы-

таться их разрабатывать, особенно если учесть то, что их единствен-

ное преимущество, - значительно меньшая вероятность фальсифи-

кации результатов, нежели в других методиках. В конце концов,

лучше иметь валидный тест, результаты которого, вероятно, могут

быть искажены испытуемым, чем невалидный, но противостоящий

всем попыткам фальсификации.

Cattelln Kline (1977) утверждают, что существует теоретическое

преимущество объективных тестов, и столь значительное по сравне-

нию с опросниками, что усилия, затраченные на разработку валид-

ных объективных тестов, вполне оправданы. Дело прежде всего а том,

что значение (смысл) слов и содержание вопросов изменяются со

временем, а это ставит под вопрос состоятельность лонгитюдных

исследований личности. Значение наших вопросов (утверждений),

конечно же, изменяется от культуры к культуре, поэтому проведение

кросс-культурных исследований личности при помощи опросников

116

чрезвычайно сложно, если вообще возможно. Неоспорим и тот факт,

что с различиями в понимании наших заданий мы сталкиваемся при

обследовании разных общественных классов в рамках одной и той же

культуры. Kelly (1955) как-то даже заявил, что значения слов на-

столько различны для разных индивидуумов, что любая форма стан-

дартизированного тестирования не имеет сколь-нибудь значитель-

ной диагностической ценности. Вследствие этого Келли и его после-

дователи придавали особое значение методике репертуарных реше-

ток, где каждая решетка была индивидуальна для испытуемого, чьи

качества исследовались. Несколько примеров убедят в наличии этого

обстоятельства.

(1) «Нравятся ли вам веселые вечеринки?» (англ.:»0о you like gay

parties?»). По-русски этот вопрос звучит весьма прилично и вполне

приемлем как задание теста. По-другому дело обстоит с его англий-

ским вариантом. Примерно до 1960 года этот вопрос (в англоязычных

странах) не имел гомосексуального подтекста. «Gay party» - это

была вечеринка, отличавшаяся доброжелательным отношением ее

участников друг к другу, живым весельем и юмором. Сегодня слово-

сочетание «gay party» означает «встреча для гомосексуалистов».

(2) «Нравится ли вам игра «Урони платок»?» Этот вопрос имеет

смысл только в условиях северо-американской культуры: ни в Анг-

лии, ни в других странах Европы в эту игру не играют и, следователь-

но, там ее скрытый смысл не известен. Поэтому этот вопрос нельзя

использовать в кросс-культурных исследованиях.

(3) «Регулярно ли вы ходите в кино?» Сейчас положительный

ответ на этот вопрос указал бы на неподдельный интерес к фильмам.

А двадцать лет назад, до всеобщего распространения телевидения,

посещение кинотеатра было принятой большинством людей формой

развлечения, и ответ «нет» мог, вероятно, представлять интерес.

Объективные тесты, напротив, должны помочь выявить данные,

которые не подвержены влиянию изменяющегося смысла заданий, а,

следовательно, необходимы для изучения тех преобразований лич-

ности, которые происходят во времени, а также для сравнения раз-

личных групп.

Принципы конструирования объективных тестов

Поскольку возможно предположить существование огромного ко-

личества разнообразных объективных тестов, необходимо, чтобы их

разработчики руководствовались некоторыми общими принципами.

Cattell и Warburton (1967) в руководстве по объективным тестам

личности и мотивов, а в нем перечислены 688 тестов для измерения

более чем 2300 переменных, считают это количество лишь неболь-

шой частью тех, которые могли бы быть разработаны. Однако, эти

авторы отдают себе отчет в том, что прежде чем подумать об отказе

от разработки объективных тестов из-за их ошеломляющего потен-

циального количества (ибо даже многие из приведенных в их руко-

водстве переменных остались без экспериментального опробования

и с неустановленной валидностью), необходима некоторая их таксо-

номия, и это сделано в упомянутой книге. Приведем краткое изложе-

ние.

Психологические тесты могут отличаться один от другого по сле-

дующим признакам:

(1) Инструкции. Ясно, что они важны, поскольку определяют то,

как испытуемый воспринимает тест (хотя испытуемые могут не всег-

да придавать им значение).

(2) Материал теста. Он может быть взят из социальной области

или, например, из физики.

(3) Особенности оценивания полученных от испытуемого отве-

тов.

Понятно, что эти три элемента не являются независимыми, так

как инструкции должны отражать определенный стимульный мате-

риал. Кэттелл и Уорбертон предпочли объединить первые два эле-

мента и обозначить это термином «стимульно-инструктивная си-

туация» (stimulus-instruction situation).

СТИМУЛЬНО-ИНСТРУКТИВНАЯ СИТУАЦИЯ

Стимульно-инструктивная ситуация изменяется в зависимости

от ряда параметров:

(1) Реакция или ее отсутствие. В общем требуется реакция на

стимул. Но это не всегда так, как, например, в тестах на чувствитель-

ность к боли.

(2) Ограниченность versus неограниченность способов реагирова-

ния. В тестировании не известны случаи неограниченного разнооб-

разия ответов. Предполагается, что испытуемые (как аргументиру-

ют Кэттелл и Уорбертон) не будут жевать материал тестов или пор-

тить его. Однако ответы могут быть относительно свободными, как,

например, в тесте Роршаха, или с накладываемыми на них ограниче-

ниями, как при измерении времени реакции.

(3) Ответы, придуманные (созданные самостоятельно) versus ото-

бранные из набора вариантов. Значение этого параметра очевидно.

Примером последних являются ответы типа «правда-неправда», а

примером первых - описание рисунков Теста тематической аппер-

цепции (Thematic Apperception Test - TAT).

118

(4) Единичные versus повторяющиеся ответы.

(5) Последовательность ответов: упорядоченная versus неупоря-

доченная. Это относится к тому, до какой степени от испытуемых

требуется давать ответы в определенном порядке.

(6) Однородность versus разнородность ответов. В некоторых тес-

тах требуются ответы одного и того же вида, а в других предусмотре-

ны ответы различных типов.

(7) Естественность темпа versus ограниченность времени на отве-

ты. Сравните такие инструкции, как, например: «Работайте со свой-

ственной вам скоростью», «Не тратьте слишком много времени на

каждый вопрос» и «Работайте настолько быстро, насколько это воз-

можно.»

(8) Завершенность (окончательность) реакции versus реагирова-

ние на реакцию. Испытуемый реагирует либо на материал теста,

либо на свою собственную реакцию, например, тот или иной стимул

как-либо оценивается, вызывает ассоциации или воспоминания.

Cattell и Warburton (1967) считают, что это основные, не требую-

щие дополнительной аргументации, параметры вариативности, свя-

занные со стимульно-инструктивной ситуацией. Однако, ими пред-

ставлены и три других, более субъективных параметра, которые при

разработке объективных тестов могут приобрести особое значение.

(9) Явный смысл versus неявный. Некоторые тесты не имеют ни-

какого вне их лежащего значения, такие как измеряющие время

реакции. Однако в определенных тестах (там, где интересуются мне-

нием о чем-либо) это присутствует. Большинство видов искажений и

сложностей, связанных с субъективным истолкованием слов и поня-

тий возникают именно в тех тестах, значение которых неявно.

(10) Представление теста в виде отдельных заданий versus целост-

ное представление. Этот параметр касается различий между тестами,

состоящими из отдельных заданий или из одного единственного.

(II) Психологическая сущность действия, необходимого для вы-

полнения задания. Этот параметр учитывает, требуется ли для отве-

та: (а) знания (напр., верное суждение); (б) мнение о чувствах,

отношениях; или (в) опознание или распознание.

Как утверждают Cattell и Warburton (1967), существуют еще два

параметра:

(12) Различия в мотивах приемлемости ситуации тестирования.

(13) Различия в свободе выхода из ситуации тестирования.

Вышесказанное обуславливает существование 2 типов стимуль-

но-инструктивных ситуаций.

Значение приведенных классификационных принципов огромно:

если бы мы конструировали такой материал для объективных тестов,

119

в целом содержавший бы в себе все эти параметры, то использовали

бы все возможные виды материала. Это особенно важно, поскольку

при применении этих тестов всегда есть опасность, что для данного

теста специфично проявляется больше вариативности, чем это жела-

тельно.

Как уже говорилось, еще одним важным источником различий

между тестами является то, каким образом обрабатываются показа-

тели, полученные с их помощью. Cattell и Warburton (1967) в иссле-

довании ответов на тесты вводят некоторые параметры обработки

показателей по тесту. Хотя эти параметры и не являются полно-

стью независимыми от стимульно-инструктивных параметров, при-

веденных выше, они существенно отличны.

Прежде чем перейти к описанию этих параметров, следует под-

черкнуть, что ответы на тесты образуют весьма значительное число

переменных. Например, если бы мы рассматривали в качестве объ-

ективного теста личностный опросник, то, в добавление к стандарт-

ной шкале подсчета показателей могли бы быть вычислены следую-

щие переменные: время выполнения теста, время выполнения поло-

вины теста, количество подтвержденных ответов «да», количество

подтвержденных ответов «нет», количество альтернативных отве-

тов, количество пропущенных заданий, количество неопределенных

ответов («не знаю», «не уверен»). Следует заметить, что все эти

показатели, в отличие от показателя по стандартной шкале, являют-

ся объективными, поскольку ни один испытуемый не может знать,

что они измеряют, и они могут быть измерены с высокой надежно-

стью, не зависящей от лица, проводящего тестирование.

Параметры оценивания ответов

(1) Объективность versus субъективность оценивания. Этот мо-

мент касается в основном тех тестов, в которых используются зада-

ния на самооценку. Будет ли ответ испытуемого оцениваться так, как

это предполагается инструкцией или каким-либо неизвестным для

него образом? В этом нет никакого обмана для испытуемых. Напри-

мер, объективным тестом является тест критических оценок

(Critical Evaluations Test, Т8, Cattell и Warburton (1967)). В нем

испытуемых просят указать, является ли определенная производи-

тельность труда, - например, если у официантки уходит десять

минут на то, чтобы принести шесть порций на столик, - очень

хорошей, хорошей, плохой, очень плохой. А в этом тесте между

прочим определяется количество критических оценок. Субъективное

содержание заданий не имеет отношения к оценке. Таким образом,

этот тест, внешне напоминающий опросник, является, фактически,

120

полностью объективным, как это и определено в начале данной гла-

вы. Разумеется, все те тесты, которые будут обсуждаться в этой главе,

являются объективными в смысле этого первого параметра.

(2) Целостное поведение (весь организм) versus физиологическая

реакция (часть организма). Типичной физиологической реакцией

может быть покраснение от смущения или тремор.

(3) Измерение одного возможного ответа versus классификация

разнообразных ответов (параметрическое оценивание versus непара-

метрическое) . Параметрически измеряются такие особенности отве-

та: время, количество ошибок, повторений. Непараметрически рас-

крывается количество и разнообразие классов ответов. В этом смысле

многие тесты на креативность оцениваются непараметрически.

(4) Общее количество ответов versus часть, соответствующая не-

которому критерию. Это пересекается с описанным выше третьим

параметром, поскольку, как указывают Cattell и Warburton, различ-

ные оценки могут быть любой из указанных здесь категорий.

(5) Единый однородный показатель versus разнотипные относи-

тельные показатели. Определить единый показатель можно только

тогда, когда тест оценивается в целом, как в случае личностных

опросников. Разнотипные относительные показатели могут опреде-

ляться в следующих формах: различия во времени выполнения пер-

вой и второй частей теста; запоминание материала при обычных

условиях и при отвлекающих обстоятельствах.

И, наконец, Cattell и Warburton добавили шестой параметр:

(6) Нормативное оценивание versus ипсативное (личностное) .

Однако этот параметр, по-видимому, представляет совершенно иной

тип классификации, чем та, о которой шла речь выше, так как он

оказывает влияние на все тесты и более правильно было бы отнести

его к области стандартизации, а не конструирования тестов.

Если мы примем в рассмотрение и этот параметр, у нас получится

2 возможных типов оценивания ответов.

Таким образом, выделенные параметры, связанные со стимульно-

инструктивной ситуацией и оцениванием ответов, позволят нам кон-

струировать тесты любого типа. Однако, такой подход, хотя и явля-

ется полезным, все же не может помочь нам в том, что касается

содержания объективных тестов. Кроме того, показано, что потенци-

альное количество типов объективных тестов действительно огром-

1 ч (

но: 2 Х 2, что значительно больше 50000. Многие из них, однако,

Нормативные показатели позволяют делать внешние сравнения относительно нор-

мативной выборки, а ипсативные (личностные) допускают сравнение выражен-

ности тех или иных особенностей относительно самого испытуемого (например, в

опросниках интересов) (Прим.ред.)

121

нежизнеспособны, но даже при этом их количество все еще слишком

велико. Выделенные параметры указывают, до какой степени могут

различаться задания каждого возможного типа объективных тестов,

которые проходили испытания. Мы никогда не будем испытывать

недостатка в заданиях!

Для использования в практике конструирования объективных те-

стов эта классификационная схема должна быть сокращена. Кэттелл

и Уорбертон подчеркивают, что особую важность имеют шестьдесят

четыре варианта, полученные из трех наиболее важных ситуаций и

параметров оценивания, генерирующих по восемь возможных вари-

антов. Огромное количество тестов в их сборнике не покрыло все

шестьдесят четыре типа, так что такая краткая версия таксономии

тестов также еще оставляет пространство деятельности для творче-

ского разработчика тестов. Такая таксономия, основывающаяся на

характеристиках тестов, может помочь разработчику создавать раз-

нообразные тесты, но есть одна основная трудность: как мы узнаем,

что созданные средства измерения будут измерять, например, пере-

менные темперамента, а не другие? Иными словами, как нам пол-

учить тест для измерения темперамента, а не, например, способно-

стей? Данная таксономия в этом помочь не может, и разработчику

тестов нужна дальнейшая информация.

Различия между объективными тестами способностей,

темперамента и динамики (мотивов)

Один из методов определения того, что же измеряют объективные

тесты, - подвергнуть их факторному анализу вместе с хорошо изве-

стными отличительными переменными (маркерами) этих трех мо-

дальностей (способностей, темперамента, мотивов). С помощью

факторного анализа будет выяснено, переменные какой модальности

измеряет данный тест. Однако, хотя это и эффективная процедура,

необходимая до реального использования любого объективного теста,

она не указывает нам, как можно сконструировать тест нужного нам

типа. Это лишь адекватное средство проверки, но не руководство для

конструирования тестов.

Cattell и Warblirton (1967) посвятили обсуждению этой проблемы

довольно много места, а здесь мы лишь кратко подытожим их рассуж-

дения, поскольку они обеспечивают некоторое рациональное основа-

ние для выбора содержания заданий (в дополнение к таксономии,

призванной помочь в выборе формы тестов).

(1) Различаются два вида ситуаций (ситу ационализм, фактичес-

ки, не является противоположностью психологии черт): побуждаю-

122

щие (incentives) и связанные с осуществлением действия (complexi-

ties).

(2) При изменении побудителей (incentives) изменяются показа-

тели динамических тестов. При изменении деятельностей (complexi-

ties) изменяются также показатели тестов способностей. Тесты тем-

перамента включают все остальные ситуации.

(3) Определение побудителей (incentives): побудители порожда-

ют стремление к некоторой цели и являются символом цели или

удовлетворения от достижения цели, что само по себе может быть

выявлено только анализом этого процесса. Это статистический ана-

лиз последовательности поведения во времени. Данная последова-

тельность является набором действий, ведущих к достижению цели.

Побуждающая ситуация, таким образом, распознается по ее отноше-

нию к цели (то есть по общим колебаниям в силе стремления и

постоянству доминирования). Kline и Grindley (1974) действительно

показали именно такие флуктуации между динамическими измере-

ниями и ситуациями.

(4) Определение деятельностей (complexities). Когда побудители

в данных обстоятельствах уже распознаны, можно определить и дея-

тельность: это все то, что не является побудителем.

(5) Конечно, на практике это означает, что измерение динамики

и способностей тесно взаимосвязано. Однако, могут быть получены

относительно «чистые» средства измерения для каждой из этих обла-

стей. Например, если бы у нас были очень простые средства измере-

ния способностей, то различия в показателях отражали бы не способ-

ности, а динамику (например, насколько испытуемые старательно

выполняют задание). Таким образом, можно так управлять уровня-

. ми деятельностей и побудителей, что объективные тесты могут стать

практически «чистыми» средствами измерения каждой модальности.

(6) Нет необходимости говорить, что все тесты, сконструирован-

ные таким образом, должны быть подвергнуты проверке при помощи

факторного анализа. Нужно убедиться, что то, что они измеряют,

соответствует тому, что от них ожидали. Все тесты, предположитель-

но измеряющие способности, должны дать близкие результаты, то же

касается измерения мотивационных, динамических переменных.

С этим логическим обоснованием, с различиями между побудите-

лями и деятельностями, у разработчика объективных тестов уже есть

некоторое руководство, по крайней мере относительно выявления

того, что его тесты измеряют, хотя все они по-прежнему должны

подвергаться последующей проверке факторным анализом.

Однако, как сейчас должно быть очевидно читателю, эти принци-

пы и таксономии интересны и, возможно, могут явиться стимулом к

123

работе, но, вероятно, слишком абстрактны для практического ис-

пользования при конструировании реальных тестов. Cattell и War-

burton ( 1967), осознавая это, в своей работе чистосердечно признают,

что при конструировании объективных тестов им помогало лишь

интуитивное предвидение, основанное на значительном опыте исс-

ледований в этой области. Это мы сейчас кратко и обсудим.

Практические советы для разработки объективных тестов личности

и мотивов

Следует избегать следующих пяти ошибок, которые Cattell и War-

burton (1967) упоминают как распространенные среди любителей, и

о которых необходимо знать, прежде чем приступать к работе по

конструированию объективных тестов.

(1) Не останавливайтесь на очевидно валидных заданиях из оп-

росников.

(2) Не применяйте задач или заданий-головоломок (загадок). С

их помощью вы скорее всего будете измерять факторы способностей.

(3) Не возлагайте слишком большие надежды на «стрессовую

ситуацию». Как утверждают Cattell и Warburton (1967), это может

сработать для выявления агрессии или страха, но ведь есть еще и

другие эмоции.

(4) Эстетические и стилистические предпочтения могут эффек-

тивно выявить лишь некоторые аспекты личности. Однако, будет

абсурдом ожидать, что такие тесты выявят все возможные аспекты.

Нужно учитывать тот очевидный факт, что на ответы по этим тестам

влияют уровень образования и культуры.

(5) Избегайте упрощенных способов использования проективных

тестов. Wenig (1952) показал, чтотакиетестыдиагностируютвесьма

широкий комплекс параметров, требующий факторно-аналитиче-

ского исследования.

(6) Используйте задания-вопросы, точно соответствующие опре-

деленным типам поведения.

Вышесказанное является основой для создания эффективных объ-

ективных тестов.

Решение некоторых общих проблем, связанных

с объективными тестами

Существует ряд проблем, из-за которых интерпретация показате-

лей любого теста (не только объективного) может стать сомнитель-

ной, и их следует учитывать при конструировании объективных тес-

тов. Подробное обсуждение этих проблем, к которому можно ото-

124

слать читателей, представлено в книге Cattell и Warburton (1967).

Кратко подытожим те положения, о которых идет речь в этой работе.

РАЗЛИЧИЯ В МОТИВАЦИИ ИСПЫТУЕМЫХ

Различия в мотивации испытуемых при разработке тестов имеют

особое значение в научных исследованиях, тогда как при отборе и

выдаче рекомендаций значение этого источника индивидуальных

различий по-видимому минимально. В конце концов, если для вы-

полнения объективного теста требуется, например, значительная

концентрация внимания, почему испытуемый должен делать уси-

лия, чтобы выполнить все наилучшим образом? С другой стороны,

встречаются испытуемые, которые вообще все делают наилучшим

образом. Cattell и Warburton (1967) обсуждают пять приемов постро-

ения объективных тестов, призванных в некоторой мере минимизи-

ровать различия в мотивации испытуемых.

( 1 ) Поделите тест на две части. Получаемым показателем являет-

ся отношение или разность оценок по первой и второй части, и две

части сравниваются, при том резонном предположении, что у каждо-

го испытуемого мотивация на выполнение каждой части одинакова,

и таким образом этот эффект устраняется. Примером такой методики

является тест «силы Эго», основанный на эффективности запомина-

ния при отвлекающих факторах. В этом тесте показателем «силы

Эго» является разность между оценкой по запоминанию чисел в

обычных условиях и оценкой по запоминанию чисел в том случае,

когда они перемежаются шутками. Это явно полезный прием для

проектирования объективных тестов.

(2) Используйте в качестве мотивов базовые эрги, а не чувства. В

терминологии Кэттелла (см. Cattell и Child, 1975; Cattell и Kline,

1977) эрги - это базовые влечения, такие как голод, половое влече-

ние или страх, тогда как чувства - это то, что прививается, форми-

руется при обучении и воспитании в определенной культуре, напри-

мер, религиозные чувства или чувства по отношению к своей семье.

Поскольку, как обсуждалось у Cattell и Child (1975), базовые эрги

менее подвержены изменчивости, чем чувства, то количество разли-

чий вследствие изменений в мотивации сокращается, если при вы-

полнении теста в качестве мотивов широко вовлекаются базовые

эрги. Проще всего при этом управлять страхом (удара электрическим

током) или сексуальными желаниями (предъявляя картинки с обна-

женными), хотя следует отдавать себе отчет, что эти влечения не

Cattell в своей концепции мотивации разграничивает понятия «эрг» (искусствен-

ный термин, призванный заменить термины «потребность» и «побудительная си-

ла») и «чувство» («сентимент»). Чувства и эрги не являются совершенно независи-

мыми друг от друга (Прим.ред.)

могут проявиться так, как в реальности (по степени возбуждения),

ибо существуют определенные этические нормы, реализующиеся и в

ситуации тестирования.

(3) Ограничивайте подсчет показателей стилистическими или

формальными аспектами выполнения теста. Эти переменные менее

подвержены изменениям мотивации, чем большинство других. Кэт-

телл и Уорбертон выбрали почерк как пример того показателя, кото-

рый обычно остается распознаваемым для каждого индивидуума в

разнообразнейших ситуациях.

Характеризуя эти три приема преодоления мотивационных иска-

жений, необходимо отметить один очевидный, но важный момент:

они применимы в основном к тестам темперамента, а не динамики.

(4) Вполне возможно, что мотивационный уровень испытуемого

при работе над всей батареей тестов может быть отделен факторным

анализом (вероятно, в один или более факторов) от других независи-

мых факторов. Если это так, то переменные, имеющие тенденцию

быть нагруженными такими факторами, могут быть отброшены.

(5) И наконец, разработчик объективного теста может намеренно

искать способ задействовать мотивы каждого испытуемого таким об-

разом, чтобы они были активно вовлечены в тестовые процедуры, но

при этом следует постоянно помнить о том, что нельзя выходить за

границы той системы ценностей, которой привержены испытуемые.

К сожалению, это тот принцип, который легче понять, чем воплотить

в практику.

ЛИЧНОСТЬ И ТЕСТОВАЯ СИТУАЦИЯ

Проявления личности связаны с социумом, однако при тестирова-

нии социум представлен только в виде тестовых ситуаций. Это, ко-

нечно, еще одна существенная проблема тестирования, кстати дав-

шая повод ситуационалистам (напр., Mischel, 1968) подвергнуть со-

мнениям эффективность личностных тестов. Так, Mischel утверж-

дал, что факторы, полученные при помощи традиционных личност-

ных опросников, являются по своему существу факторами ситуации

тестирования.

Чтобы преодолеть эту трудность, Cattell и Warburton (1967) пред-

ложили индивидуальные тестовые ситуации, которые несомненно

включают в себя социальные взаимодействия. Однако, эти же авто-

ры, к сожалению, утверждают, что такие мини-ситуации трудно

создавать и трудно использовать в практической психологии, таким

образом значительно уменьшая их значение для достижения каких-

Подробнее о взакмодествии ситуационных и личностных переменных см.: оурла-

чукЛ. Ф. (1989) (Прим.ред.)

либо иных целей, кроме теоретических. Правда, эти авторы надеют-

ся, что последующие исследования позволят измерять при помощи

других объективных средств более простого вида те факторы, которые

определяются тестами мини-ситуаций. Если это произойдет, то от

ситуационных тестов можно будет отказаться. Однако, без них раз-

работчик объективных тестов не может испытывать уверенность в

том, что он измерял социальное поведение (поведенческие проявле-

ния личности). Было разработано несколько групповых тестов, на-

груженных факторами социального взаимодействия (они перечис-

лены в Cattell и Warburton, 1967), но в этой области еще многое

предстоит сделать.

ВЛИЯНИЕ СПОСОБНОСТЕЙ И ДОСТИЖЕНИЙ НА ПОКА-

ЗАТЕЛИ ОБЪЕКТИВНЫХ ТЕСТОВ

Это основная трудность, которая должна быть преодолена при

конструировании объективных тестов личности (тестов темперамен-

та и динамики). Например, известно (Cattell и Child, 1975), что

информация о релевантных цели обследования предметах и явлени-

ях является эффективным средством измерения интереса. Элемен-

тарная рефлексия, однако, с очевидностью показывает, как может

быть искажено такое измерение. Незначительный интерес у студента

к конным бегам (а корпуса естественно-научных факультетов Киев-

ского университета находится рядом с ипподромом ) может привести

к некоторому запасу знаний, который не может быть сравним со

знаниями менее интеллектуального человека, для которого это было

единственным видом отдыха. Информационный тест, следовательно,

будет работать неправильно.

Таким образом, должны разрабатываться приемы проектирова-

ния тестов, которые минимизируют влияние способностей и дости-

жений. Cattell и Warburton (1967) дают следующие рекомендации.

(1) Устраняйте, насколько возможно, из объективных тестов пе-

ременные способностей - например, направленные на выявление

отношений, словарный запас, общие знания.

(2) Как было ранее показано на примере разных мотивов, разби-

вайте тест на две части и используйте отношение или разность пока-

зателей. Это устраняет влияние уровня способностей испытуемого,

как это происходило и с уровнем мотивации.

(3) Подвергните тесты факторному анализу и устраните те, кото-

рые нагружены факторами способностей.

В оригинале: «Кембридж находится рядом с Ньюмаркетом» (Прим.перев.)

127

(4) Используйте в батарее объективных тестов настолько широ-

кий набор проб содержательного материала, навыков и интересов,

насколько это возможно.

Переменные поведения должны обеспечивать разнообразие роле-

вых ситуаций, так как личностные факторы лучше всего, вероятно,

выражаются в различных ролях. Содержание также должно быть

подобрано таким образом, чтобы затронуть интересы всего диапазона

выборочной совокупности испытуемых. Это также важно, поскольку

a priori маловероятно, что одна частная тестовая форма, пусть даже

эффективная, сможет охватить полностью всю личностную сферу, то

есть всю гамму факторов.

ГРУППОВЫЕ ИЛИ ИНДИВИДУАЛЬНЫЕ ТЕСТЫ

Ориентируйтесь на разработку простых тестов для группового

тестирования, а не индивидуальных тестов. Это необходимо как для

исследований больших выборок, так и в практической психологии,

где групповая работа является необходимостью. Следует, однако

указать, что создание групповой версии индивидуального теста тре-

бует значительной изобретательности и исследовательских усилий

для демонстрации того, что каждая из этих версий действительно

измеряют одну и ту же переменную. В то же время некоторые объек-

тивные тесты, например, те, основу которых составляют физиологи-

ческие измерения, нельзя преобразовать в групповую форму.

В дополнение к этим полуформальным рекомендациям Cattell и

Warburton (1967) обсуждают интуитивные основания некоторых из

своих тестов, поскольку при разработке объективных тестов все еще

необходимо определенное чутье, интуиция, ибо нет еще единого ал-

горитма. Будет достаточно лишь перечислить эти основания, так как

разработчики тестов могут их либо использовать, либо нет, иначе

говоря, некоторые разработчики могут обладать достаточным вооб-

ражением, чтобы творить тесты с их помощью, тогда как другие не

смогут делать этого, поскольку правила, вытекающие из этих осно-

ваний, не могут быть точно сформулированы. Наиболее важными

основаниями являются: (1) клиническая интуиция; (2) наблюдение

в повседневной жизни случаев, являющихся определяющими для

характеристики личности; (3) повседневная устная речь - послови-

цы и поговорки; (4) эмоциональные ситуации в играх, например, в

карточных; (5) поведение, наблюдаемое в ходе беседы; и (6) литера-

турные источники.

Cattell и Warburton (1967) также утверждают, что ряд положений,

которые, по их мнению, являются нечетко сформулированными пси-

хологическими принципами, весьма помогал им при разработке тес-

тов. Однако автор данной книги счел эти положения слишком рас-

плывчатыми, чтобы их использовать (напр., «избирательное дейст-

вие восприятия и памяти в соответствии с общей ориентацией») при

практической разработке тестов, хотя они весьма полезны для пони-

мания оснований некоторых объективных тестов Кэттелла.

И наконец, Cattel и Warburton считают, что при разработке объ-

ективных тестов могут быть полезны некоторые из эксперименталь-

но-психологических открытий (таких как те, которые касаются, на-

пример, взаимосвязей между обусловливанием и научением, ЭЭГ и

характеристиками личности; см. Eysenck, 1967).

Таковы советы относительно формы и содержания объективных

тестов для пытающихся их создавать, тестов, которые будут корре-

лировать с некоторыми внешними критериями. Есть надежда, что все

эти советы окажут свое воздействие, побуждая читателей к разработ-

ке тестов. Несмотря на это, следует еще раз подчеркнуть, что ни один

тест не может использоваться, прежде чем не будет продемонстриро-

вано, что он измеряет те переменные, для измерения которых пред-

назначен.

Объективные тесты и факторы личности

Cattell и Warburton обсуждают также вопрос о том, как можно

проектировать объективные тесты по отношению к явным конструк-

там, под которыми они, естественно, понимают личностные факто-

ры. Конечно, принципы, обсуждаемые ниже, могли бы использовать-

ся и для разработки тестов, не основанных на факторной стратегии.

Однако, факторно-аналитические конструкты по определению име-

ют очевидное подтверждение (их факторные нагрузки), следователь-

но они представляют прекрасный объект для измерений (в отличие

от многих клинических конструктов, за которыми может не быть

никакой реальности, кроме воображения их создателей).

Суть этого метода состоит в использовании переменных-маркеров

для уже установленных факторов (существуют их разнообразные

списки, см., напр., Howarth, 1976дляфакторовличностныхопросни-

ков), а затем разработки тестов, которые, вероятно, нагружены эти-

ми факторами. Последующий факторный анализ выявляет тесты,

которые нагружены этими факторами. Этот метод идеально подходит

для разработки объективно-тестовых средств измерения, эквивален-

тных факторам, известным по другим тестам - полезная процедура,

поскольку, по крайней мере, с точки зрения профотбора, результаты

выполнения объективных тестов не могут быть фальсифицированы.

Однако, как показывают на примерах Cattell и Warburton, этот метод

может привести к открытию новых факторов, не обнаруживаемых ни

5 4-196 129

при каком другом типе тестирования. Это можно легко себе предста-

вить в случае, когда множество объективных тестов формируют фак-

тор, размещенный между двумя факторами-маркерами.

При разработке объективных тестов по уже установленным фак-

торам, если мы хотим получить точные результаты, следует помнить

о следующих моментах:

(1) Необходимо воспроизведение всех факторных структур на

различных выборках. В идеале, как показывает Nunnally (1978), для

таких исследований требуется в десять раз больше испытуемых, чем

переменных, с которыми ведется работа. Однако, в случае повторе-

ния выделенной факторной структуры, такое строгое требование не

является, вероятно, необходимым.

(2) Изучение тестов, нагруженных некоторым фактором, помога-

ет уточнить конструкт рассматриваемого фактора. Так иногда нагру-

женность объективных тестов помогает узнать что-то новое о тех

факторах, которые считались хорошо изученными.

(3) Гораздо более интересным является то, что факторные нагруз-

ки могут помочь прояснить, что же измеряют объективные тесты

(вечная проблема объективных тестов).

(4) Исходя из факторной нагруженности тестов нередко можно

создать новые тесты. Другими словами, непосредственное наблюде-

ние за тем, как выявляются переменные (то есть как бы взгляд назад)

чрезвычайно полезно как вспомогательное средство при разработке

тестов. Таким образом, одним из наиболее важных путей создания

объективных тестов является изучение тех реальных факторов, ко-

торые из них выделяются. Их порой трудно идентифицировать без

последующего использования факторного анализа и разнообразного

экспериментального материала, но по крайней мере при попытке

измерения таких факторов разработчик объективных тестов будет

нацелен на статистически значимый конструкт.

ЗАКЛЮЧЕНИЕ

Было немало сказано о двух подходах к разработке объективных

тестов, предназначенных для изучения темперамента. Вы увидели,

что существуют некоторые полезные наставления, приемлемые для

работающих в этой наиболее трудной области тестирования, прави-

ла, касающиесяформыисодержаниятестов. Несмотрянато, что хотя

я и показал, как некоторые явные проблемы могут быть искусно

обойдены, очевидно, что многое зависит от: (а) интуиции, основан-

ной на знании общей психологии и ранее изученных факторов тем-

перамента, и (б) реальных факторов, выявляющихся в исследовани-

ях.

130

Я не предложил более подробного рассмотрения конструирования

объективных тестов, потому что с моей точки зрения существует

такое огромное количество уже созданных, но с неизвестной валид-

ностью, что разработчику тестов лучше было бы посоветовать изу-

чить на практике то, что уже сделано, прежде чем приниматься за эту

трудную задачу самому. Многие из широко известных и эффективно

валидизированных объективных тестов были разработаны Айзенком

и его коллегами в Моудслейском госпитале, и большинство из этих

средств измерения относятся к трем основным факторам: экстравер-

сии, нейротизму и психотизму. Подробности об этих тестах могут

быть найдены в различных местах объемных публикаций Айзенка,

но лучше всего воспользоваться работой, изданной в 1971 г. (Eysenck,

1971).

Однако, наиболее значительные усилия по конструированию объ-

ективных тестов, были предприняты в Иллинойсе Кэттеллом и его

коллегами. Их исследования сформировали основу нашего обсужде-

ния, как об этом и было сказано в начале главы. Cattell и Warburton

(1967) приводят столь значительный перечень объективных тестов,

что их психологическое значение еще предстоит осмыслить. Буду-

щий разработчик объективных тестов должен, конечно, знать этот

перечень и опробовать все подходящие тесты, содержащиеся в нем,

прежде чем браться за их самостоятельную разработку.

Объективные тесты мотивов или динамики

Все, что до сих пор было сказано о разработке объективных тестов,

касается измерения темперамента. Очевидно, что таксономия типов

тестов в равной степени применима и к объективным тестам мотивов.

То же касается и второго подхода, основанного на изучении резуль-

татов факторного анализа. Тем не менее, Кэттеллом и его коллегами

были предложены определенные принципы для разработки объек-

тивных тестов мотивов, которые не применимы к тестам темперамен-

та, их мы сейчас и обсудим.

Принципы конструирования объективных тестов мотивов были

подробно описаны в следующих работах: Cattell (1957), Cattell и

Warburton (1967), Cattell и Child (1975), Cattell и Kline (1977). Здесь

вы найдете краткое изложение этих принципов, вполне удовлетво-

ряющее потребности разработчика тестов.

ТЕОРЕТИЧЕСКИЕ ОСНОВАНИЯ

В теоретическом подходе Кэттелла к мотивации поведения пред-

полагается, что мотивы проявляются в аттитюдах. Так, например,

тот факт, что некоторый индивидуум очень заинтересован в получе-

нии денег, должен отражаться в силе его побуждения (drive).

Cattell и Child (1976) использовали динамическую решетку, что-

бы показать, как такие аттитюды могут соотноситься с побуждения-

ми. В данном примере наличие денег желательно для высокой само-

оценки (самоощущение), для обеспечения своей семьи (супружеские

чувства) и для гарантированного будущего своих детей (эрг защи-

ты) . Обратите внимание, что здесь предполагается конечное количе-

ство побуждений у людей, как следует, например, из представлений

McDougall (1932). Считается, что побуждения могут быть двух ви-

дов: (1) эрги, базовые для всех человеческих существ (например,

половое побуждение); и (2) чувства, сформированные культурой и

воспитанием (такие, как чувства к семье). Если мы в чем-либо заин-

тересованы, то наши аттитюды зависят существенным образом от

того, как посредством активности они выражаются в наших побуж-

дениях и чувствах. Интерес к психоанализу, например, может ока-

заться средством выражения полового побуждения. Все это означает,

что сущность объективных тестов, предназначенных для измерения

мотивационных факторов, связана с аттитюдами и интересами.

Заслуживает упоминания еще один аспект теоретического подхо-

да, принятого Кэттеллом и его коллегами. Это касается силы интере-

са. Два человека могут быть заинтересованы в одном и том же, но их

интересы могут значительно различаться по силе. В работе, прове-

денной Cattell и Child (1975), четко показано, что из анализа атти-

тюдов с помощью объективных тестов, выделяются факторы силы и

интересов, как и факторы, отражающие структуру интересов, то есть

основные человеческие побуждения, эрги и чувства.

Принципы конструирования объективных тестов мотивов долж-

ны исходить из этих основополагающих теоретических положений.

Это основа для измерения мотивов при помощи тестов аттитюдов и

интересов. Cattell и Kline (1977) перечисляют шестьдесят восемь

психологических принципов, на которых должно основываться изме-

рение мотивов. Их можно также найти в Cattell и Kline (1975). Эти

принципы приведены в табл. 4.1.

Как это подробно описано у Cattell и Child (1975), многие из этих

принципов были реализованы в тестах и в воспроизводимых (повтор-

но измеряемых) факторах силы интереса, были выделены и некото-

рые отчетливые эрги и чувства. Например, были опубликованы груп-

повой тест MAT (Cattell и др., 1970) и его версия для подростков -

SMAT.

Таблица 4.1. Некоторые принципы измерения мотивов, применяемые при конст-

руировании тестов

С возрастанием интереса в направлении действия ожидайте, что будут нарастать:

(1) Предпочтения. Готовность признать предпочтение в направлении действия.

(2) Аутизм: неправильное, искаженное восприятие объектов, звуков и т.п., в соответ-

ствии с интерерм (примером является исследование Брунера по восприятию ве-

личины монет) .

(3) Аутизм: ошибочные убеждения. Необоснованная уверенность в том, что факты и

происходящие события благоприятствуют направлению действий.

(4) Искажение логических построений: средства - конечный результат. Готовность

утверждать, что малоэффективные средства достижения цели в действительности

являются эффективными.

(5) Искажение логических построений: конечный результат - средства. Готовность

утверждать, что конечного результата можно легко достичь при помощи несоот-

ветствующих для этого средств.

(6) Искажение логических построений: индуктивных.

(7) Искажение логических построений: дедуктивных.

(8) Искажение логических построений: выявление отношений из воспринимаемого

(напр., аналогий).

(9) Выбор вспомогательных средств. Готовность использовать землю, труд и капита-

ловложения во имя интереса.

(10) Макиавеллианизм. Желание использовать предосудительные средства для дости -

жения конечного результата во имя своего интереса. (Желание достичь цели

любой ценой - все средства хороши).

(II) Предпочтения в воображении. Готовность выбирать связанные с интересом темы

для чтения, рассказа или объяснения.

(12) Предпочтения в размышлениях. Проведение времени в размышлениях над тем,

что связано с интересом.

(13) Предпочтения в идентификации. Предпочитает быть похожим на индивидуумов,

одобряющих направление его действий.

(14) Защитная сдержанность (скрытность). Запинание («спотыкание») при перечис-

лении (назывании) негативных последствий избранного направления действий.

(15) Защитная беглость речи. Беглость речи при перечислении позитивных следствий

направления действий.

( 16) Защитная беглость речи. Беглость речи при перечислении оправдывающих обсто-

ятельств в пользу действия.

(17) Рационализация. Готовность интерпретировать информацию таким образом.

чтобы представить свой интерес в более респектабельном виде, чем он есть, и т.п.

(18) Наивная проекция. Ошибочное восприятие других людей как имеющих его

собственные интересы.

(19) Истинная проекция. Ошибочное восприятие другихлюдей как осуществляющих

столь же предосудительное поведение, связанное с преследованием интереса, как

его собственное.

Мак-Доуголл насчитывает у человека 18 основных побудительных сил (Прим.

ред.)

132

Вгопеги Goodman (1947) показали, что дети, оценивая величину монет, обнару-

живают отчетливую тенденцию к ее переоценке. При этом, чем выше стоимость

монеты, тем больше наблюдается ошибок в оценке ее величины. Дети из малообес-

печенных семей значительно больше переоценивали величину монет, нежели их

более обеспеченные ровесники. Выявленная тенденция отсутствовала в случае

предъявления детям картонных кружков вместо монет (Прим.ред.)

133

(20) Проекция Id. Ошибочное восприятие других как имеющих его собственные при-

митивные желания, связанные с интересом.

(21) Проекция Superego. Ошибочное восприятие других как имеющих его собственные

убеждения в правоте, связанные с интересом.

(22) Чувство вины. Выражение чувства вины от неучастия в деятельности, связанной

с интересом.

(23) Вовлеченность в конфликт. Трата времени на принятие решения при выборе

путей для реализации интереса (оба альтернативных пути благоприятны для реа-

лизации интереса).

(24) Вовлеченность в конфликт. Трата времени на принятие решения в конфликте,

вызванном желанием избежать альтернативных решений (обе альтернативы про-

тивоположны интересу).

(25) Реагирование на угрозу. При возникновении угрозы интересу падает сопротивле-

ние при измерении КГР.

(26) Реагирование на угрозу. При возникновении угрозы интересу усиливается сер-

дечно-сосудистая активность.

(.27) Физиологическая вовлеченность. При возрастании интереса (под угрозой или

нет) усиливается сердечно-сосудистая активность.

(28) Физиологическая вовлеченность. При возрастании интереса увеличивается тем-

пература пальцев.

(29) Физиологическая вовлеченность. При возрастании интереса увеличивается ри-

гидность мышц.

(30) Интеграция при восприятии. Организация неструктурированного материала в

соответствии с интересом.

(31) Перцептивная замкнутость. Способность видеть незавершенные рисунки завер-

шенными, если материал имеет отношение к интересу.

(32) Избирательность восприятия. Легкость нахождения связанного с интересом мате-

риала, вкрапленного в сложно оформленные объемы информации,

(33) Острота сенсорных ощущений. Тенденция ощущать свет ярче, звуки громче и т.п.

при возросшем интересе.

(34) Внимательность. Сопротивление отвлекающим факторам (световые сигналы,

звуки и т.п.) при работе с относящимся к интересу материалом.

(35) Спонтанное внимание. Непроизвольные движения, вызванные связанными с

интересом раздражителями (напр., движения глаз),

(36) Вовлеченность. Кажущаяся быстрота, с которой течет время при занятиях, свя-

занных с интересом.

(37) Настойчивость. Продолжение работы во имя интереса даже при встрече с труд-

ностями.

(38) Персеверативность. Упорство в неадаптивном поведении, связанном с интересом.

(39) Рассеянность. Неспособность управлять вниманием при помехе со стороны свя-

занного с интересом раздражителя (стимула).

(40) Ретроактивное торможение при помехе выполнению связанной с интересом зада-

чи.

(41 ) Проактивное торможение заданием, связанным с интересом.

(42) Рвение: усилия. Предвосхищение затраты еще больших усилий в направлении

действия.

(43) Деятельность: время. Трата времени в направлении действий.

(44) Рвение: деньги. Предвосхищение еще больших затрат денег в направлении дейст-

вия.

(45) Деятельность: деньги. Трата денег в направлении действий.

(46) Рвение: исследования. Готовность предпринять исследования для достижения

связанных с интересом конечных результатов.

134

(47) Импульсивность: решения. Быстрота принятия решений в пользу интереса, почти

отсутствие конфликта.

(48) Импульсивность: согласие. Быстрота согласия с мнениями, благоприятными для

интереса.

(49) Сила решения. Высшая степень уверенности в ситуациях, благоприятствующих

направлению действия.

(50) Быстрота воодушевления (раскачки): обучение. Быстрота воодушевления (рас-

качки) для изучения задач, связанных с интересом.

(51) Обучение. Быстрота обучения связанному с интересом материалу.

(52) Моторные навыки. Соответствующая производительность, когда затрагивается

интерес.

(53) Информация. Знания, имеющие отношение и влияющие на направление дейст-

вия.

(54) Сопротивление угасанию реакций, относящихся к интересу.

(55) Контроль. Способность координировать деятельность, преследующую интерес.

(56) Расположенность: легкость. Легкость, непринужденность в письменном изложе-

нии того, что связано с направлением действий.

(57) Расположенность: свободные ассоциации. Готовность к ассоциациям на темы

связанного с интересом материала без каких-либо ориентирующих стимулов.

(58) Расположенность: скорость свободных ассоциаций. Увеличивающееся количест-

во ассоциаций при возросшем интересе.

(59) Расположенность: ориентированные ассоциации. Готовность к ассоциациям на

темы связанного с интересом материала при стимуляции.

(60) Расположенность: память. Свободное воспроизведение связанного с интересом

материала.

(61) Память на вознаграждения. Немедленное воспоминание о наградах, связанных с

интересом.

(62) Реминисценция. Эффект Уорда-Ховлэнда. Улучшение сохранения связанного с

интересом материала при его воспроизведении через небольшие промежутки вре-

мени.

(63) Реминисценция. Эффект Бэлларда-Уилльямса. Улучшение сохранения связан-

ного с интересом материала при его воспроизведении через значительные проме-

жутки времени.

(64) Сохранение в памяти поЗейгарник. Тенденция вспоминать незавершенные зада-

чи, связанные с интересом.

(65) Персеверативность по Зейгарник. Готовность возвращаться к незавершенной

задаче, связанной с интересом.

(66) Защитная забывчивость. Неспособность вспомнить относящийся к интересу ма-

териал, если цель недостижима.

(67) Фацилитативность рефлекса. Легкость, с которой возбуждаются определенные

рефлексы при возросшем интересе.

(68) Торможение рефлекса. Трудность возбуждения определенных рефлексов при

возросшем интересе.

Источник: R.B.Cattell and D.Child. Motivation and Dynamic Structure. London: Holt,

RinehartandWinston, 1975.

Однако, как и в случае объективных тестов темперамента, разра-

ботчику объективных тестов следовало бы посоветовать попытаться

использовать тесты из «Сборника объективных тестов» (Cattell и

Warburton, 1967), прежде чем приступать к разработке каких-либо

собственных средств измерения. Действительно, конструирование

135

объективных тестов требует значительного опыта и мастерства, а для

психологов, которые хотят получить какие-либо тесты для практи-

ческого использования, будь то решение исследовательских задач

или профотбор, попытка конструировать такие тесты вряд ли будет

удачной, несмотря на значительные затраты времени и работу по

апробации вариантов теста и их валидизации. Внимательный чита-

тель мог заметить, что я опустил изложение специальных методов

для измерения динамических конфликтов. Дело в том, что в настоя-

щее время свидетельства исследователей в пользу валидности этих

методик слишком умозрительны, чтобы в полной мере использовать

их на практике, а не только для дальнейшей разработки этой несом-

ненно важной области исследования мотивов. (Более подробные све-

дения читатели могут получить в работе Cattell и Child, 1975).

Другие аспекты конструирования объективных

тестов мотивов

Хотя в таблице 4.1. приведены основополагающие принципы, в

свете которых должны разрабатываться объективные тесты мотивов,

заслуживают внимания и некоторые другие аспекты.

ПЕРЕХОД К ИПСАТИВНЫМ (личностным) ПОКАЗАТЕЛЯМ

Если мы рассмотрим принципы 42, 43, 44, 45 и 60 из табл.4.1., то

становится очевидным, что добровольная трата времени и денег на

некоторую деятельность и наличие соответствующей информации о

ней являются мерами мотивации субъекта к этой деятельности. Од-

нако, как уже указывалось ранее, такое измерение сводится на нет

индивидуальными различиями, такими как способности, наличие

свободного времени и денег. Для того, чтобы избавиться от этого

очевидного источника ошибок, показатели ипсатизируются, то есть

показателем испытуемого является отклонение от среднего значе-

ния, определенного у неготемжетестом. Так, еслимиллионертратит

400 фунтов стерлингов на флейту, это явно указывает на меньший

интерес, чем у студента консерватории, делающего то же самое.

Ипсатизация устраняет этот не нужный нам источник различий.

ЧУВСТВА И ЭРГИ

Как уже было сказано в кратком изложении теоретических основ

разработки объективных тестов мотивов, есть два аспекта в измере-

нии мотивов: сила интереса и базовые мотивационные цели, побуж-

дения (drives); в принятом нами подходе - эрги (ergs) и чувства

(sentiments). Принципы конструирования тестов, представленные в

табл.4.1., предназначены для решения первой задачи: измерения

силы мотивов.

136

Следовательно, здесь имеет смысл рассмотреть конструирование

тестов, направленных на измерение эргов и чувств. Фактически, как

указывают Cattell и Warburton (1967), обсуждавшиеся принципы

применимы к тестам побуждений потому, что, например, тест аутиз-

ма (принципы 2 и 3 в табл.4.1.) может быть использован для измере-

ния желаемого, принимаемого за действительное применительно к

большому разнообразию объектов: к пище (эрг голода), к женщинам

(половой эрг) или к решению задач (эрг любопытства). Здесь все

зависит, как и всегда при конструировании тестов, от изобретатель-

ности разработчика тестов. Однако, специфические свойства каждо-

го конкретного теста оказывают влияние на то, какие аспекты побу-

дительно-мотивируемого поведения будут измеряться. Из этого сле-

дует, что для того, чтобы измерить весь диапазон мотивов индивиду-

ума необходим широкий выбор тестов (включающих столько прин-

ципов из табл.4.1., сколько возможно), измеряющих адекватный на-

бор его аттитюдов, чем обеспечивается полный охват всего разнооб-

разия чувств и эргов.

ФОРМИРОВАНИЕ НАБОРА АТТИТЮДОВ

Вы, надеюсь, заметили, что в предыдущем параграфе было ис-

пользовано выражение «адекватный набор аттитюдов». Это было

сделано потому, что явно невозможно достичь идеала - охватить все

аттитюды испытуемого. При таком положении дел в процессе конст-

руирования объективных тестов важно определить, какие аттитюды

должны войти в набор. Cattell и Warburton (1967) утверждают, что

это может быть сделано первоначально a priori продуманным отбо-

ром аттитюдов, о которых можно судить, что они, вероятно, относят-

ся к наиболее важным побуждениям (напр., голод и половое влече-

ние) , а затем позже эмпирически дополнять другими аттитюдами

(для которых побуждения лишь интуитивно угадываются либо даже

неизвестны) в процессе исследований с переменными - маркерами

повторяющихся побуждений. Эта проблема вновь указывает на зна-

чительные трудности, с которыми сталкивается разработчик тестов

при изучении мотивов.

В исследованиях Кэттелла и его коллег (описанных в Cattell и

Warburton, 1967; Cattell и Child, 1975) подвергнуты изучению около

шестидесяти аттитюдов, каждый из которых, похоже, насыщен как

эргом, так и чувством. Это поясняется нижеследующими примерами.

(Тем не менее, прежде чем будут описаны эти примеры, следует

осознать, что этот подход имеет ограничения: наши гипотезы могут

быть неверными, и можно не заметить чрезвычайно важные пере-

менные.) Например, (1) Я хочу быть таким человеком, которого

137

каждому хотелось бы видеть рядом с собой. Это выявление эрга стад-

ности (потребности в обществе, в общении) и чувства по отношению

к самому себе, самоощущения. (2) Я хочу пойти домой и отдохнуть

после трудного дня. Этим аттитюдом измеряется эрг стремления к

отдыху и чувство к своему дому. (3) Я хочу видеть, что смертность

из-за несчастных случаев и болезней сократилась. Здесь мы имеем

дело с выявлением эрга страха.

Примеры объективных тестов

О конструировании объективных тестов сказано уже достаточно.

Были приведены все принципы и методические указания, и единст-

венное, что остается - это дать несколько примеров. Я выбрал их из

«Сборника объективных тестов» Cattell и Warburton (1967). Они

были отобраны, чтобы показать как изобретательность, с которой

были разработаны тесты, так и разнообразие тех, что сконструирова-

ны к настоящему времени. Кроме того, выбор указывает и на трудно-

сти при разработке объективных тестов. Вот названия некоторых из

400 объективных тестов, разработанных к настоящему времени:

Желание подшучивать действием

Готовность принимать быстрые решения в процессе адаптации к

темноте

Амплитуда голоса при нормальных условиях по сравнению с ус-

ловиями задержанной обратной связи (искусственно создаваемой от-

срочкой в поступлении звука собственного голоса)

Знание общественного этикета

Базовая скорость метаболизма

Эйдетическое воображение

Вычеркивание букв (задание на внимательность), сравниваемое

в двух ситуациях

Готовность имитировать звуки, издаваемые животными

Критическая частота слияния мигающих кадров

Скорость появления негативных последовательных образов

Предпочтение раскрашивать цветными карандашами свои собст-

венные, а не предъявляемые рисунки

Частота тремора в решающей ситуации

Продолжительность смеха над шутками

Расширение зрачка после испуга

Большее количество беспокойных движений при ожидании, изме-

ренное фиджетометром (см. стр. 140)

Скорость копирования изображения (эскиза, чертежа)

от англ. fidget - 1. ерзать, суетиться; 2. нервные движения, беспокойство (Прим.

перев.).

138

Высота башни из кубиков (для детей 6 лет)

Внимательность при следовании подробным инструкциям

Точность в завершении гештальта

Расстояние, которое проходит палец испытуемого по тесту-лаби-

ринту, при электрошоке и без него

Эти названия дают прекрасное представление о богатейшем раз-

нообразии разработанных тестов. Сейчас некоторые из них будут

описаны более подробно. Это высветит существующие проблемы и

сделает понятным, почему я не советую предпринимать легкомыс-

ленные попытки разработки таких тестов.

ЖЕЛАНИЕ ПОДШУЧИВАТЬ ДЕЙСТВИЕМ

Это объективный тест из разряда опросников. Испытуемый выра-

жает свое желание подшучивать действием. Основанием для разра-

ботки этого теста послужило предположение о том, что застенчивые

испытуемые должны быть расположены к таким невербальным шут-

кам. Факторные исследования подтвердили это предположение, а

кроме того оказалось, что и уверенным в себе, не проявляющим

застенчивости испытуемым также нравятся эти действия. Последнее

- неожиданное открытие.

Этот тест показывает сложности проектирования объективных

тестов, поскольку следовало бы ожидать, что этот тест будет насыщен

фактором эксвии , так как экстравертам нравятся такие шутки, а

интровертам нет.

ГОТОВНОСТЬ ПРИНИМАТЬ БЫСТРЫЕ РЕШЕНИЯ В ПРО-

ЦЕССЕ АДАПТАЦИИ К ТЕМНОТЕ

При проведении этого теста испытуемый находится в темной ком-

нате. Затем включается яркий свет, и ему предлагают смотреть на

белый экран. Потом говорят, что когда свет выключится, он увидит

букву. Испытуемый должен назвать букву, как только ее увидит.

Используются три буквы. Измеряемой переменной является время,

которое проходит до того, как буква будет названа. Основанием для

разработки этого теста явилось предположение о том, что испытуе-

мые с доминированием процесса торможения должны демонстриро-

вать более быструю адаптацию к темноте.

Этот тест не сложен, не требует дорогостоящего оборудования, но

он пригоден в основном для индивидуального применения, хотя воз-

можна и групповая форма с использованием оборудования лингвис-

Этим термином Кэттелл обозначает фактор второго порядка («эксвия-инвия»), в

состав которого входят пять факторов первого порядка. Подробнее об этом см.:

Мельников В. М.,ЯмпольскийЛ.Т. (1985) (Прим.ред.)

139

тической лаборатории. Kline и Gale (1969) показали, что с помощью

такой процедуры можно удачно использовать проективный тест

«Картинки Блэкки» (Blum, 1949) для группового тестирования (без

потери элемента неразглашения тайны, связанного с индивидуаль-

ным тестированием и существенного при проведении данного объек-

тивного теста).

БАЗОВАЯ СКОРОСТЬ МЕТАБОЛИЗМА

В этом тесте величина минимального потребления испытуемым

кислорода за шесть минут преобразуется в калории/час на квадрат-

ный метр поверхности тела. Первоначально полагали, что этот тест

будет иметь отношение к витальности (exuberance), реактивности,

мобилизационной силеорганизма и экстраверсии. Действительно, он

насыщен первыми тремя факторами, но также - фактором застен-

чивости и непрактичности.

: Как вынужденно свидетельствуют Cattell и Warburton ( 1967), со-

всем не просто теоретизировать с какой-либо степенью точности и

ответственности о психологических аспектах физиологических фун-

кций.

БЕСПОКОЙНЫЕ ДВИЖЕНИЯ, ИЗМЕРЕННЫЕ ФИДЖЕТО-

МЕТРОМ

Фиджетометр - это вращающееся кресло с электрическими кон-

тактами в различных местах, которые замыкаются при движениях.

Показателем является общее количество движений, зарегистриро-

ванных в течение фиксированного промежутка времени. Конструк-

ция этого кресла такова, что испытуемые не замечают в ней ничего

необычного. Основанием для разработки этого теста явилось предпо-

ложение о том, что тревожные (anxious) люди должны совершать

больше суетливых, беспокойных движений, как и те, у кого высокая

степень базальной тревоги. На деле же исследования так ни разу и не

показали зависимости между показателями по этому тесту и факто-

ром тревожности, хотя для базальной тревоги это имело место.

Фиджетометр - это хороший пример объективного теста с той

точки зрения, что его показатели трудно фальсифицировать, и в то

же время можно легко и точно обрабатывать. Он также с очевидно-

стью показывает проблемы, су шествующие для объективных тестов,

так как подходит только для индивидуального использования и, не-

смотря на изобретательность, с которой он был реализован (хотя в

действительности это электрифицированная модель прибора, изо-

бретенного еще Гальтоном), он лишь незначительно насыщен только

одним фактором. Такой тест должен был бы быть лучше!

140

На этих примерах в полной мере показаны опасности и трудности,

возникающие на пути объективного тестирования. Было уже сказано

достаточно, чтобы позволить разработчику тестов продвигаться да-

лее, но я должен опять повторить свое предупреждение: этот путь не

для слабодушных. Разумеется, самые лучшие тесты личности - не-

зависимые от культурных особенностей испытуемых, объективные,

те, получаемые с помощью которых показатели трудно исказить.

Объективные тесты удовлетворяют этим требованиям. Однако, что-

бы получить такой тест, необходимо приложить огромные исследова-

тельские усилия.

Проективные тесты

Как уже говорилось ранее, в соответствии с вышеприведенным

определением, проективные тесты в действительности являются под-

множеством объективных тестов. Однако, поскольку некоторыми из

наиболее известных психологических тестов являются именно про-

ективные тесты - например, тест Роршаха или тест тематической

апперцепции (Thematic Apperception Test - TAT) - и поскольку

термин «проективные тесты» все еще широко используется в психо-

логии, я решил, что будет правильно рассмотреть конструирование

проективных тестов отдельно.

Ранее в своих работах я полностью описал природу проективных

тестов и их критику со стороны академических психологов в силу

низкой надежности и валидности. Я не намерен повторять эти рас-

суждения здесь. Достаточно лишь сказать, что по существу, как

утверждает Semeonoff (1977), проективный тест является стимулом,

обычно достаточно неопределенным, созданным для того, чтобы вы-

явить внутренние потребности, напряжения, беспокойства и кон-

фликты испытуемых - их «идиодинамику», по выражению Rosen-

zweig (1951). Теоретической основой для разработки проективных

тестов является тот факт, что когда испытуемых просят описывать

неопределенные стимулы, полученное описание не может отражать

сами стимулы (из-за их расплывчатости), а, следовательно, должно

отразить нечто внутреннее, присущее самим испытуемым. Это ут-

верждение применимо ко всем формам проективного тестирования,

таким как рисунки, завершение предложений или игра с куклами.

Таким образом, искусство проективного тестирования традиционно

имеет два аспекта: (а) разработка такого стимульного материала,

чтобы он действительно выявлял представляющие интерес личност-

ные ответы; и (б) интерпретация результатов.

Можно отметить, что критические замечания по поводу проектив-

ных тестов, такие, как кратко перечисленные Айзенком (Eysenck,

141

1959), в основном направлены на второй аспект, интерпретацию, что

не имеет прямого отношения к концепции объективных тестов Кэт-

телла, поскольку и он, и его коллеги используют тест Роршаха, но

объективно оцениваемый. Таким образом, критика не касается соб-

ственно стимульного материала, хотя может возникнуть вопрос, мо-

жет ли один набор чернильных пятен Роршаха или картинок ТАТ

полностью охватить всю личностную сферу. И наконец, если мы

вспомним нашу психометрическую модель переменных теста из гла-

вы 1, то можно предположить, что в этих тестах должна существовать

некоторая специфическая переменная, и именно она одна приводит

к искажению результатов. В то же время в критических замечаниях

Айзенка, по существу, нет ничего такого, что говорило бы о том, что

проективное тестирование бесполезно. Необходимо только реализо-

вать объективное оценивание показателей и отказаться от бессвяз-

ных интерпретаций, столь излюбленных многими исследователями,

использующими проективные тесты.

О пользе разработки новых проективных тестов

С одним лишь тестом Роршаха было выполнено несколько тысяч

исследований. К 1978 году по ТАТ насчитывалось более 2000 иссле-

дований (см. Buros, 1978). С этими тестами, как и с рядом других

проективных тестов, было проведено множество сложнейших клини-

ческих исследований. При таком огромном количестве исследований

и относительно скудных позитивных открытиях, конечно же, от про-

ективных тестов следовало бы отказаться. А если и не отказываться,

то, конечно, нет никакой необходимости в конструировании новых

проективных тестов. Как может (следуя этим аргументам) отдель-

ный исследователь или даже небольшая группа таковых надеяться

открыть что-нибудь полезное разработкой новых проективных тес-

тов, когда пятьдесят лет тестирования по Роршаху доказали обрат-

ное?

Эти возражения против проективного тестирования в том виде, в

котором они традиционно приводятся, выглядят весьма убедительно.

В то же время существует ряд аргументов в поддержку разработки

новых проективных тестов, и они приведены ниже.

АРГУМЕНТ 1

Во-первых, Холли в серии исследований теста Роршаха и других

проективных методик показал (см., напр., Holley, 1973), что тест

Роршаха, будучи подвергнут объективной обработке результатов и

мощному мультивариационному статистическому анализу, является

впечатляющим инструментом отчетливого выделения различных

групп психических больных. Исходя из этого, он утверждает, что,

вероятно, тест Роршаха действительно является настолько полезным

тестом, насколько в этом убеждают нас его клинические привержен-

цы, а попытки многих академических исследователей подтвердить

его валидность потерпели неудачу не столько из-за слабости самого

теста, сколько из-за скудности их собственных обычно одномерных

статистических методов. Если этот аргумент состоятелен, то он ко-

нечно же, может быть в равной степени применим к другим проек-

тивным тестам.

Следует указать, что открытия Холли были повторены многими

его учениками, особенно Вегелиусом (Vegelius, 1976), который даже

разработал свой собственный статистический подход. Hampson и

Kline (1977) также использовали его статистические методы при

исследовании преступной личности с помощью различных проектив-

ных тестов, таких как «Дом-дерево-человек» (Buck, 1948) и ТАТ,

и вновь эти методы оказались весьма многообещающими.

Подход к вычислению показателей по методике Холли прост до

крайности. Протоколы проективных тестов подвергаются подробно-

му содержательному анализу, и баллами 0 или 1 оценивается отсут-

ствие или присутствие тех или иных особенностей. Так, если испы-

туемый А описал таблицу V теста Роршаха как «череп», он получает

1 балл. Все остальные испытуемые получают по этой переменной 1,

если они как-либо упоминали череп, и 0, если нет. Таким образом

можно объективно оценивать практически любой ответ. Данные оп-

росов в равной степени поддаются обработкеэтим методом. Изучение

надежности шкалирования, проведенного разными исследователя-

ми, указывает на ее очень высокую степень. Более, чем 90-процент-

ная согласованность была обнаружена практически по всем перемен-

ным (Hampson и Kline, 1977).

Заслуживает внимания одно замечание об этой системе подсчета

показателей (помимо ее крайней утомительности!) При подсчетах

неизменно встречается большое количество переменных, которые

оцениваются 1 балломтолькоуодногочеловека.Этоискажаетлюбые

последующие корреляции, поскольку все испытуемые, получившие

по такой переменной 0, представляются более похожими (близки-

ми), чем они в действительности, являются. Следовательно, нужно

отбрасывать любую переменную, которая была оценена 1 баллом

менее чем у пяти-шести испытуемых.

В качестве статистического анализа Холли использовал факто-

рный анализ типа Q, то есть вычислялись и подвергались факторному

анализу корреляции между испытуемыми, а не между переменными.

Результирующими факторами, следовательно, были группы испыту-

143

емых. Этот метод очень хорошо подходит для работы с особыми

группами при изучении психических расстройств или преступников.

Специфической особенностью этого анализа является использо-

вание показателя корреляции О (НоНеу и Guilford, 1964) для уста-

новления корреляций между испытуемыми. Этот коэффициент име-

ет то преимущество по сравнению с коэффициентом <р и четырех-

польным коэффициентом корреляции, что на его величину не влияет

способ расщепления заданий теста, а его стандартная погрешность не

является чрезмерно большой. Наиболее важно то, что этот коэффи-

циент не изменяется в зависимости от полярности задания - суще-

ственная особенность в тех случаях, когда корреляционная матрица

будет подвергаться дальнейшему статистическому анализу. И нако-

нец, как показал Vegelius (1976), как и <р, (однако, в отличие от

четырехпольного коэффициента корреляции (Nunnally, 1978)), по-

казатель G математически удобен для факторного анализа.

Как только факторы Q (испытуемые) выделены, применяется

простой коэффициент D для того, чтобы увидеть, какие из перемен-

ных наилучшим образом разделяют эти группы, - полезное вспомо-

гательное средство при определении этих факторов и тех перемен-

ных , которые наилучшим образом извлекают их из данных проектив-

ных тестов.

При рассмотрении этого анализа заслуживает упоминания ряд

моментов. Во-первых, эта методика явно пригодна для исследования

групп - либо когда мы хотим разделить по уже созданным ранее

группам, либо когда мы пытаемся выяснить, может ли быть найдена

какая-либо значимая классификация. В первом случае, например,

G -анализ мог бы быть полезен в кросс-культурных исследованиях

или при изучении успевающих и неуспевающих испытуемых в ка-

ком-либо обучающем курсе. Во втором случае, G-анализ имеет зна-

чение, если предполагается выделение подгрупп: очевидными при-

мерами здесь могут быть исследования испытуемых с дислексией или

депрессией. Однако, понятно, что G-анализ может быть применен

только в классификационных исследованиях. Это не панацея для

всего анализа проективных тестов.

В связи со сказанным можно было бы утверждать, что дискрими-

нантный функциональный анализ мог бы предоставить такое же

эффективное решение, хотя использование 0 и 1 в качестве оценок

могло бы доставить трудности. Сравнение этих двух методов в ряде

исследований было бы весьма ценным. Из этого ясно, что наиболее

общая полезная особенность исследований Холли - это система объ-

ективной обработки результатов тестов, хотя, если нас интересуют

144

групповые различия, G -анализ является, несомненно, точной и про-

стой процедурой.

Таким образом, я бы сказал, что подход к обработке тестов Pop-

шаха, разработанный Холли, - это сильный аргумент в пользу того,

чтобы не отказываться от проективных тестов как от полезных пси-

хологических инструментов. Следовательно, это и ответ на вопрос о

том, имеет ли ценность разработка некоторых новых проективных

тестов. В самом деле, мы можем идти дальше. Может оказаться по-

лезным попытаться разработать проективные тесты, имея в виду

объективную систему вычисления показателей, то есть такие тесты,

ответы на которые будут наиболее поддающимися такой обработке.

В исследовании, выполненном Hampson и Kline (1977), было обнару-

жено, что в некоторых тестах, особенно в тесте «Дом-дерево-чело-

век», легче обрабатывать показатели таким образом, чем в других.

Также оценивался объективно и ТАТ, но возникло такое чувство,

будто некоторая часть богатства протоколов была в этой процедуре

утрачена.

В заключение можно сказать, что работы Холли подтверждают

целесообразность разработки новых проективных тестов, которые,

вероятно, будут более легко обрабатываться с помощью рассмотрен-

ного объективного приема.

АРГУМЕНТ 2

Второй, более общий аргумент в пользу сохранения проективных

тестов и разработки новых исходит из самой природы данных проек-

тивных тестов. Ответы на проективные тесты не похожи на ответы

испытуемого в любой другой ситуации. С помощью этих тестов мы

видим такие аспекты испытуемых, о которых в других случаях мы бы

не знали ничего. Таким образом, терять такие данные - не лучший

чуть. Это подводит нас к третьему аргументу.

АРГУМЕНТ 3

Новые проективные тесты должны быть более специфичными, а

не общими. Одним из критических замечаний по поводу теста Pop-

шаха, выдвинутых Айзенком (Eysenck, 1959), является, как он пи-

шет, малая вероятность (и это относится ко всем тестам) того, чтобы

один тест был в состоянии измерить все личностные особенности. В

физике, например, термометр измеряет температуру, а вольтметр -

напряжение электрического тока. Говоря более строго, это замечание

касается насыщенности теста Роршаха разнообразными общими

факторами. Сказанное справедливо и для многих других проектив-

ных тестов. Например, ТАТ используется сейчас для исследования

большого количества разнообразных переменных (как можно уви-

145

деть по работе Semeonoff, 1976), несмотря на то, что первоначально

он был разработан для измерения потребностей (needs) и давлений

среды (presses) (и их существует много) в соответствием с персоно-

логией Мюррея (Murray, 1938).

Впрочем, созданные позднее проективные тесты уже предназна-

чались для более узких, специфических целей. Так, тест Блюма

«Картинки Блекки» (Blum, 1949) создан для измерения психосексу-

альных переменных в фрейдовском их понимании, и каждая картин-

ка имеет свое конкретное предназначение, например, для выявления

комплекса кастрации. В тесте Кормана PN (Соппап, 1969) каждая

картинка также имеет вполне определенное назначение. Однако, ни

один из этих тестов не получил убедительного доказательства его

валидности. Следовательно, можно утверждать, что поскольку дан-

ные, получаемые с помощью проективных тестов, не могут быть

добыты иным путем, есть смысл в разработке новых, но таких, кото-

рые направлены на изучение конкретных аспектов личности. По-

скольку валидность была доказана лишь для небольшого количества

проективных тестов, остается обширная область для последующих

исследований.

АРГУМЕНТ 4

Четвертый аргумент связан с перцепт-генетическими методика-

ми (percept-genetic methods) (Kragh и Smith, 1970), разработанными

в университетах Лунда и Осло, благодаря которым могут быть вали-

дизированы новые проективные тесты. Перцепт-генетический под-

ход - это исследование развития образов (percept), как это и следует

из его названия. Смит и Крэгх в течение ряда лет в своих исследова-

ниях применяли экспериментальный прием, основанный на тахи-

стоскопической проекции стимулов при постепенно возрастающей

скорости до тех пор, пока испытуемый еще в состоянии давать соот-

ветствующее описание. Kragh (1970) утверждал, что развитие образа

этих стимулов (поскольку в начале последовательности нет никаких

ответов) отражает базовое развитие личности, позволяя даже уло-

вить как бы отблески реальных жизненных событий, и таким образом

эта методика дает возможность постичь важные моменты постоянно

используемых защитных процессов испытуемого. Следует отметить,

что в перцепт-генетической теории утверждается, что в нормальном

повседневном восприятии происходит именно такое же развитие об-

разов, только осуществляется это мгновенно. Тахистоскопическое

представление стимулов позволяет экспериментатору наблюдать

этот мгновенный в обычных условиях процесс.

146

Хотя изложение положений перцепт-генетической теории не

имеет отношения к предмету данной книги, клинических результа-

тов, собранных Крэгхом и Смитом (Kragh и Smith, 1970) и последу-

ющими исследователями в Лунде (например, Westerlund, 1976), до-

статочно, чтобы предположить, что при помощи перцепт-генетичес-

ких методик могут быть разработаны эффективные тесты. Действи-

тельно, тест защитных механизмов (Defence Mechanism Test) был

разработан Крэгхом (Kragh, 1969) именно таким образом и оказался

полезным для решения разнообразных прикладных задач. Я экспе-

риментировал с этими методиками, и в одном исследовании со спе-

циальными стимулами (Kline и Cooper, 1977) защитные механизмы

были выявлены. Однако, дальнейшие исследования с другими (и

предположительно лучшими) стимулами оказались неудачными

(Kline, 1980). Несмотря на это, перцепт-генетическая методика

предъявления стимулов все же, по-видимому, является полезным

способом представления стимулов проективных тестов.

ЗАКЛЮЧЕНИЕ

Этот раздел в защиту разработки новых проективных тестов будет

завершен следующим кратким изложением основных аргументов.

Имеет смысл разрабатывать новые проективные тесты, при усло-

вии, что они: (а) позволяют осуществлять объективную обработку

результатов; и (б) предназначены для изучения конкретных психо-

логических явлений. Весьма ценным может оказаться тахистоскопи-

ческое представление стимулов. В настоящее время неразумно отка-

зываться от данных, которые не могут быть получены никакими

иными тестами, кроме проективных.

Конструирование проективного теста: «Вампир-тест» (измерение

оральности)

Как стало, надеюсь, ясно, искусство конструирования проектив-

ных тестов состоит в выборе стимулов. Задача проста: найти стимул,

релевантный тому аспекту личности, который мы хотим исследовать.

Как и в случае объективных тестов, основаниями для выбора стимула

должны быть психологическая теория, экспериментальные открытия

и интуиция клинициста. Это единственные рекомендации, а далее

все полностью будет зависеть от изучения валидности полученных

данных.

Лучший способ пояснить особенности конструирования проектив-

ных тестов - дать иллюстративный пример. В течение двух послед-

них лет автор данной книги пытался разработать проективный тест

оральности, или «Вампир-тест», и сейчас будет дано краткое описа-

ние оснований для подбора тестового материала. Однако, следует

отметить, что разработка этого теста еще не завершена и до сих пор

не было получено доказательств его валидности.

ЦЕЛЬ

Ранее нами были разработаны два опросника для измерения

оральных черт личности, OPQ и OOQ (Kline и Storey, 1978). Целью

проективного теста было выяснить, связаны ли каким-либо образом

эти черты с оральностью (активностью рта, приемом пищи, сосани-

ем, кусанием, отлучением младенца от груди), как это постулирует-

ся в психоаналитической теории (Freud, 1905).

ТЕОРИЯ И ОБОСНОВАНИЕ

Как указывалось, в психоаналитической теории оральных черт

характера утверждается, что эти черты являются защитными от

орального эротизма - инфантильного получения удовольствия от

сосания и кусания. Было, решено, что стимулы следует отбирать

таким образом, чтобы они выявляли эти защитные процессы на осно-

ве различий в частоте реакций между теми, кто зафиксировался на

оральной стадии (и, соответственно, имеет много таких реакций), и

остальными, у которых нет фиксации на данной стадии.

ВЫБОР СТИМУЛОВ

Уже существуют два проективных теста с аналогичным назначе-

нием и обоснованием, но без достаточного подтверждения их валид-

ности: «Картинки Блекки» (Blum, 1949) и его французский вариант

с соответствующей адаптацией, тест PN (Corman, 1966). В тесте

«Картинки Блекки» есть две картинки, связанные с оральностью: на

одной щенок по прозвищу Блекки сосет молоко, а на другой показано,

как Блекки рвет ошейник своей мамы. Этот тест, существенно пере-

смотренный Клайном (Kline, 1973а), страдаетоттого недостатка, что

его грубые, близкие к юмористическим, картинки приводят к слиш-

ком сильному столкновению с сознательным опытом испытуемых, а

тем самым уменьшается то психологическое воздействие, которые

они могли бы оказывать. Это всегда наблюдалось при использовании

этого теста автором данной книги (Kline, 1968; Kline и Gale, 1969)

Рисунки теста PN сделаны лучше, и его основным героем является

несобака, апоросенок. Несмотрянаэто, обатестанеэффективныдля

взрослых, ибо в них предполагается, что испытуемые, идентифици-

руя себя с этими животными, будут давать менее защищенные ответы

(защитные механизмы не включаются), чем если бы главными геро-

ями были люди. На деле же оказалось, что детская форма этих сти-

148

мулов для взрослых британских испытуемых создает некоторый

барьер.

По этим причинам было решено, что лучше использовать стиму-

лы, не требующие идентификации. Были выбраны три стимула, ко-

торые, как предполагалось, будут затрагивать сущность оральности,

как это было описано в психоаналитической литературе (см. краткий

обзор у Fenichel, 1945). Мы не использовали слишком неоднозначные

стимулы, так как было необходимо, чтобы относительно стимулов

могли быть сделаны достаточно определенные гипотезы. Неодно-

значность полезна в том смысле, что оставляет простор для вообра-

жения, чего не происходит, если стимул слишком точно определен.

Если возможно использование более общего стимула, некоторая сте-

пень неоднозначности будет даже полезна.

(1) Женщина, кормящая грудью ребенка. Здесь изображена ос-

новная оральная ситуация. Молодая женщина кормит своего ребен-

ка. Отчетливо видны ее налитые молоком груди. Ее голова слегка

склонена, выражая нежность. См. рис. 4.1.

(2) Существо, похожее на волка, вонзило клыки в шею своей

жертвы. Этот рисунок был специально подобран, чтобы изобразить

жестокость орального садизма: укусы до смерти, как это, по предпо-

ложению, должно быть представлено в бессознательном. Изображе-

ние волка было выбрано потому, что оно отражает базовую оральную

свирепость. См. рис. 4.2.

(3) Вампироподобное существо пьет кровь своей жертвы. Мотив

с вампиром выбран потому, что была выдвинута гипотеза, в соответ-

ствии с которой привлекательность рассказов и легенд о вампирах, с

литературной точки зрения представляющихся банальными и скуч-

ными, состоит в замещении ими проявлений орального садизма. См.

рис. 4.3.

ПРЕДСТАВЛЕНИЕ СТИМУЛОВ

Эти стимулы представлялись тахистоскопически в соответствии с

перцепт-генетическими методиками, которые были описаны ранее.

Эти методики были выбраны потому, что они, по предположению,

позволяют выявлять защитные механизмы, а это делает их идеаль-

ными для наших целей.

РЕЗУЛЬТАТЫ

До сих пор результаты, полученные по этому тесту, не были

утешительными. Хотя и были выявлены некоторые защитные реак-

ции, не было никаких доказательств того, что лица, демонстрирую-

щие оральность в данном тесте, отличались от других испытуемых по

этому показателю, измеренному другими тестами. Это, конечно же,

149

{igun -f.l

/l, 150

не означает, что «Вампир-тест» (Vampire Test) является бесполез-

ным. Другие тесты могут быть неадекватными, или может не суще-

ствовать связи между оральными чертами личности и оральностью

(полное обсуждение этих результатов см. в Kline и Storey, 1980).

Следует отметить, что обнаружились и некоторые проблемы с экспе-

риментальным приемом представления этих стимулов, а это могло

внести свою лепту в то, что тест оказался неудачным. Вся обработка

результатов велась объективно, как описано выше.

ДАЛЬНЕЙШАЯ РАБОТА

Предполагается использовать данные стимулы в качестве обыч-

ного проективного теста и получать их описания. Также будут про-

водиться дальнейшие исследования по перцепт-генетической мето-

дике.

ВЫВОДЫ

Приведенное описание процесса разработки «Вампир-теста» бы-

ло выбрано потому, что на этом примере видно, как происходит отбор

стимулов. Если дальнейшие исследования покажут, что тест неэф-

фективен, а его результаты (в терминах факторной модели) будут

искажаться некоторой специфической переменной, будут разработа-

ны другие стимулы. В качестве таких стимулов возможны, например,

блюда с изысканной пищей, голодающий человек, изображение сцен

голода, крупные кадры лечения зубов, человек, с наслаждением по-

тягивающий пиво или шампанское.

Таким образом, должно быть ясно, что аналогичные приемы под-

бора стимулов могут быть применены для любой переменной, кото-

рая была достаточно полно описана либо в клинических, либо в

научно-исследовательских публикациях. Однако, как показывает

наш пример, это совсем не простое занятие - найти адекватные

стимулы.

Конструирование других тестов мотивов

Основные тесты мотивов, тесты динамики, являются либо объек-

тивными, либо проективными. Но существуют и другие виды тестов

мотивов, и я уделю им лишь немного места, так как в принципе при

их конструировании не используется ничего такого, что бы не обсуж-

далось ранее.

Опросники на выявление динамики

Были разработаны некоторыеопросникинавыявлениединамики,

в которых измерялись не черты темперамента, как в большинстве

151

личностных опросников, а мотивационные цели. «Список личност-

ных предпочтений» Эдвардса (Personal Preference Shedule - EPPS,

Edwards, 1959) является примером такого опросника. За исключени-

ем того, что делается попытка формулировать задания, относящиеся

к побуждениям (drives), а не к чертам, методы конструирования

таких опросников ничем не отличаются от таковых при конструиро-

вания тестов темперамента. В самом деле, если вы помните, в обсуж-

дении типов заданий для личностных опросников мы уже использо-

вали EPPS в качестве примера. Таким образом, более нечего доба-

вить о конструировании тестов такого типа.

Опросники интересов

Были разработаны некоторые интересные тесты, в которых пред-

ставлены перечни интересов, а испытуемые должны ранжировать

или оценить их; затем вычисляются показатели для различных ин-

тересов. Примером такого подхода к измерению интересов может

быть тест Rothwell- Miller (Miller, 1968). Как и в предыдущем случае,

эти тесты конструируются так же, как и личностные опросники.

Часто используются критериально-ключевые признаки (criterion-

keying) , хотя возможно применение и факторно-аналитических ме-

тодов для проверки и обеспечения того, чтобы показатели теста были

независимы друг относительно друга.

Тест длящейся реакции (The Brook-Reaction Test)

В Великобритании был разработан один тест интересов, называе-

мый The Brook-Reaction Test (Heim и др., 1969), в котором испытуе-

мые вовлекаются в процесс свободного ассоциирования, а в качестве

стимулов используются неоднозначные слова, предъявляемые устно,

одно слово в двенадцать секунд. Оценка результатов строится на том,

что слова могут вызывать интерес, а могут быть пропущены, а также

отмечаются причудливые ассоциации. По этому описанию читате-

лям ясно, что The Brook-Reaction Test является объективным тестом.

В нем используются некоторые принципы из указанных в табл.4.1,

такие как свободная ассоциация и воображение при наличии интере-

са.

Шкалы настроений и состояний

Эти шкалы - тесты временных, преходящих состояний, таких

как гнев или печаль, в отличие от более устойчивых, относительно

стабильных черт темперамента. Теперь мы изучим процесс создания

таких тестов, но это будет сделано кратко, поскольку здесь примени-

мы все методы, которые рекомендовались для конструирования лич-

152

ностных опросников как тестов темперамента. В качестве примера,

для простоты, будет использовано состояние усталости. Основные

шаги конструирования могут быть представлены следующим обра-

зом.

Формулирование заданий

СОДЕРЖАНИЕ

Перечислите все особенности поведения и чувства, имеющие от-

ношение к состоянию усталости.

ФОРМА

Преобразуйте их в задания так, как описано для заданий опрос-

ников в главе 3 (стр.93). Здесь уместны все наши замечания, касаю-

щиеся преимуществ или недостатков различных типов заданий, как

и все советы по формулированию заданий и рекомендации по избега-

нию проявления основных установок на ответы.

Действительно, с точки зрения формулирования заданий разра-

ботка шкал настроений и шкал черт личности ничем не отличаются.

Фактически различия проявляются в содержании: задания для шка-

лы настроений будут с очевидностью относиться к временным, неста-

бильным чувствам и особенностям поведения. Шкалы настроений и

состояний могут иногда наиболее явно отличаться от шкал черт тем-

перамента по инструкции.

ИНСТРУКЦИИ

Для шкал настроений и состояний существенно, чтобы испытуе-

мые понимали, что они выполняют каждое задание в соответствии со

своими настоящими, имеющими место в данное время, а не обычны-

ми ощущениями и чувствами. Чтобы быть уверенным, что это дейст-

вительно так, очевидно полезно включать такое условие в формули-

ровку заданий. Например:

СОСТОЯНИЕ: Я действительно устал сейчас

Мои ноги болят от усталости

В данный момент у меня просто слипаются глаза

Только что я чуть не провалился в сон

ЧЕРТА: Я обычно устаю до предела

Мои ноги часто болят от усталости

Очень часто у меня просто слипаются глаза

Очень часто я ловлю себя на том, что проваливаюсь в сон

Можно посоветовать использовать такие инструкции, как: «Отве-

чайте на вопросы о своем настроении и ощущениях», или «Отвечайте

153

так, как вы чувствуетесебя сейчас, в настоящий момент, даже если

обычно вы себя чувствуете иначе».

Анализ заданий

Здесь мы должны помнить обо всех замечаниях, касающихся ана-

лиза заданий для шкал темперамента. Я не буду повторять их, за

исключением того, что подчеркну наиболее существенное.

ОЦЕНИВАНИЕ ЗАДАНИЙ

Для всех показателей значение статистической погрешности дол-

жно находиться в разумных пределах.

ФАКТОРНЫЙ АНАЛИЗ ЗАДАНИЙ

Если используется факторный анализ, придется преодолевать те

же трудности, что и с тестами темперамента.

БИСЕРИАЛЬНАЯ КОРРЕЛЯЦИЯ ЗАДАНИЯ И ОБЩЕГО ПО-

КАЗАТЕЛЯ ПО ТЕСТУ

Этот метод явно подходит для данного случая и чрезвычайно

полезен как соответствующий классической модели погрешностей

измерения и простой в использовании.

МЕТОДИКА КРИТЕРИАЛЬНЫХ КЛЮЧЕВЫХ ПРИЗНАКОВ

Для шкал настроений и состояний это вполне жизнеспособная

методика, с помощью которой можно получать экспериментально

выделенные критериальные группы (criterion groups) испытуемых.

Обычно указываемый недостаток конструирования тестов с помо-

щью методики критериальных ключевых признаков - невозмож-

ность обеспечения одномерности тестовой переменной. Однако, если

группы подобраны другими способами, или может быть выдвинуто

некоторое рациональное предположение для их комплектования, то

это замечание неуместно.

Это утверждение поясним на примере. Мы можем вызвать состо-

яние утомления у нашей критериальной группы, давая испытуемым

батарею трудных тестов и другие задания и, тем самым заставив их

выполнить ряд трудных действий, требующих концентрации сил. А

последним заданием будет заполнение нашего опросника усталости.

Должны быть отобраны те задания, с помощью которых достигалось

разделение данной группы и контрольной, или те показатели, ре-

зультаты по которым отличали пост-экспериментальныеот получен-

ных до или через некоторое время после того исследования, в котором

была вызвана усталость. Следует отметить, что описанный метод

конструирования теста при помощи методики критериальных клю-

154

чевых признаков является также демонстрацией валидности, так как

валидный тест должен быть дискриминативным по отношению к

созданным экспериментальным ситуациям. Эта процедура требует,

конечно, повторной проверки на других группах.

ВАЛИДИЗАЦИЯ ТЕСТА

Если мы конструировали тест усталости с помощью бисериальной

корреляции и методики критериальных ключевых признаков, то тог-

да для его валидизации необходимо, чтобы мы продемонстрировали,

помимо очевидной валидности заданий и факта измерения ими опре-

деленной переменной, что этим тестом определяется чувство или

состояние усталости. Лучшей проверкой этого был бы специальным

образом спланированный эксперимент, что говорит в пользу отбора

заданий по методике критериальных ключевых признаков. Так,

можно было бы предположить, что значение показателей после экс-

периментальных процедур возрастет. Аналогично, мы могли бы пол-

учить показатели индивидуумов, которых мы считаем уставшими

после экзаменов или экспедиций, а затем сравнить их с показателями

не уставших (контрольных) испытуемых или с их собственными по-

казателями, но полученными несколько позже.

И наконец, следовало бы обратить внимание на один аргумент,

приводимый Cattell (1973) и Cattell и Kline (1977). В их работах

указывалось, что даже если факторный анализ уже разработанного

теста настроения показывает, что некоторый фактор присутствует,

то это еще не означает, что с его помощью обязательно будет изме-

ряться настроение или состояние. Такой Л-анализ может обнаружить

как черты, так и состояния. Целесообразно применение либо Р-ана-

лиза, в котором выявляются колебания значений некоторого фактора

у одного человека с течением времени, либо -анализа, позволяю-

щего факторизировать ретестовые изменения показателей индиви-

дуумов. В то же время справедливо и то, что если тест показал себя

валидным в процессе экспериментальной валидизации, описанном

выше, при обсуждении методики критериальных ключевых призна-

ков, то тогда не имеет смысла подвергать его Р- или -анализу.

Однако это не означает, что не стоит использовать Р- и -анализ в

исследовании настроений.

Для многих состояний (таких как депрессия или злость) экспери-

ментальные манипуляции не так просты, как в случае с усталостью,

по практическим, а иногда и по этическим соображениям. В таких

случаях -анализ больших выборок, протестированных в двух си-

туациях без экспериментального манипулирования, должен позво-

лить продемонстрировать валидность теста.

155

Краткий обзор

Шкалы состояний могут конструироваться точно так же, как шка-

лы темперамента, за исключением содержания заданий и точных

инструкций к тесту, в которых всегда подчеркивается то, что ответы

испытуемых должны касаться их состояния на момент обследования.

Валидизация лучше всего достигается путем экспериментального

создания настроения или состояния, если это возможно, в противном

случае необходим факторный Р- или -анализ, -анализ сам по

себе, без дальнейших свидетельств валидности, не эффективен.

Измерение аттитюдов

Существует три обычно используемых типа шкалы аттитюдов:

шкалы Терстоуна, шкалы Гутмена и шкалы Лайкерта. Однако я

намереваюсь обсудить полностью только конструирование шкал

Лайкерта, поскольку для двух других существуют серьезные пробле-

мы, из-за которых возможность их использования подвергается со-

мнению. Мы кратко упомянем об этих трудностях.

Шкалы Терстоуна

Основной метод конструирования шкалы аттитюдов Терстоуна

состоит из трех шагов: (1) собирается большое количество утвержде-

ний, относящихся к данному аттитюду (полезным источником могут

быть газеты); (2) эти утверждения оцениваются экспертами по 11-

балльной шкале, от «очень расположен» до «очень не расположен»;

(3) отбираются те задания, относительно которых мнения экспертов

не разошлись. Кроме того, отобранные задания должны располагать-

ся по всей 11-балльной шкале. Показателем испытуемого будет ме-

дианная шкальная цена высказываний, с которыми он согласился,

или наибольшая оценка на шкале для заданий, которые он подтвер-

дил. ,

Поскольку, как утверждает Edwards (1957), необходимо около

100 экспертов, если мы хотим получить надежное шкалирование, то

существуют очевидные трудности с подбором этих экспертов. Поми-

мо этого, если эксперты не отражают в точности ту выборочную

совокупность (популяцию, группу лиц), для которых предназнача-

ется средство измерения, то, конечно же, вся процедура будет некор-

ректной.

Nunnally (1978) весьма обоснованно подвел итог тем возражени-

ям, которые выдвигались против использования шкал Терстоуна. По

его мнению, основной трудностью в данной модели является то, что

задания очень редко к ней подходят. Сутью этой модели является то,

156

что на каждое задание имеется ключевой ответ только в одной облас-

ти значений измеряемого свойства. Так, если имеется утверждение:

«Я ненавижу войну,»- то его должны подтвердить только, те, кто

получат средний балл на шкале аттитюда к войне. Однако испытуе-

мые с сильными антивоенными настроениями также, вероятно, отве-

тят на это задание утвердительно. Таким образом, данная модель не

отражает правильно структуру аттитюдов. Другими словами, эти

задания монотонны , и это существенно для большинства заданий

для измерения аттитюдов. Однако данная модель шкалирования не

является монотонной. В ней предполагается континуальность изме-

ряемого свойства и нормальное распределение ответов на задания.

Практические проблемы, связанные с подбором экспертов, вместе с

тем фактом, что трудно подобрать задания так, чтобы они соответст-

вовали предположениям данной модели, являются вескими противо-

показаниями для использования шкал Терстоуна при измерении ат-

титюдов.

Шкалы Гутмена

Шкалы Гутмена уже упоминались в главе 1, когда было указано,

что модель Раша (в случае, если задания не различимы по трудности)

порождает вероятностную версию шкалы Гутмена. Это, однако, не-

обычный взгляд на шкалы Гутмена, который заслуживает здесь не-

сколько более подробного описания.

Шкалы Гутмена попадают в класс моделей, известных как детер-

минированные, в которых предполагается, что кривые, описываю-

щие зависимость «задание-ответ» лишены погрешностей. По шкале

Гутмена предполагается, что в случае, когда задания упорядочены по

трудности, скажем, от 1 до 20, если испытуемый выполнил задание

8, он в состоянии выполнить и задания от 1 до 7. Если же он не смог

выполнить задание 9, то он также не сможет выполнить и задания от

10 до 20.

На основе кривых, описывающих зависимости «задание-ответ», в

данной модели предполагается, что для всех значений, превышаю-

щих некоторую точку на оси измеряемого свойства, вероятность от-

вета О. равна 0, а для всех меньших значений вероятность равна +1.

Это означает, что каждое задание имеет высокую бисериальную кор-

реляцию с общим показателем, и является весьма дискриминатив-

ным в некоторой точке на континуальной оси измеряемого свойства.

Под монотонностью понимается, во-первых, то, что задание допускает как поло-

жительный, так и отрицательный ответ, во-вторых, вероятность утвердительного

ответа возрастает по мере роста значимости данной черты (свойства) и наоборот

(Прим.ред.)

157

При конструировании шкал Гутмена (уже существуют компью-

терные программы для выполнения необходимых при этом задач

сортировки больших объемов) основной целью является создание

заданий, так отобранных в порядке их трудности, что выполнение

некоторого задания означало бы, что будут выполнены и все предше-

ствующие ему задания, а неспособность выполнить некоторое зада-

ние означала бы и неспособность выполнить все последующие. Это

очевидно проще для заданий, применительно к которым такой поря-

док устанавливается относительно легко, таких как задания по мате-

матике или по теории музыки, нежели тех, что относятся к менее

структурированным дисциплинам.

По этому типу шкал высказано много критических замечаний.

Первым и наиболее важным, с нашей точки зрения, является заме-

чание, сделанное Levy (1973), хотя и не в связи со шкалами Гутмена.

Леви подчеркивает важность того, что базовая модель психологиче-

ского теста должна соответствовать объекту измерения. В данном

случае, представляется маловероятным, чтобы кривые, описываю-

щие зависимость «задание-ответ» из шкалы Гутмена, соответствова-

ли каким-либо реальным психологическим данным. Задания далеко

не всегда коррелируют на соответствующем уровне значимости с

общими показателями по измеряемому свойству; таким образом,

модель, в которой предполагается такая корреляция, не пригодна для

обработки имеющихся данных.

Еще одно критическое замечание состоит в том, что задания для

шкалы Гутмена могут отбираться просто выбором заданий, имеющих

широкий диапазон по трудности или скорости выполнения. Однако,

кривые, описывающие зависимость «задание-ответ», являются не

такими, какими они должны быть для того, чтобы удовлетворять

требованиям данной модели. Отсутствие широкого диапазона изме-

нения заданий по трудности означает, что шкалы являются коротки-

ми и, следовательно, слабо дискриминативными.

Аналогичное возражение было выдвинуто Nunnally (1978), кото-

рый указывал, что построение шкалы Гутмена в аспекте трудности

заданий не гарантирует ее одномерность. Так, легкое, среднее, весь-

ма трудное и очень сложное задания, каждое из которых измеряет

что-то свое, вероятно, могут образовать шкалу Гутмена. Однако по

какому свойству или скрытой черте будут в таком случае построены

кривые зависимости «задание-ответ»?

И последним возражением, приведенным Nunnally (1978), явля-

ется то, что шкала Гутмена - это в лучшем случае только лишь

порядковая шкала.

158

Эти критические замечания с нашей точки зрения не могут быть

опровергнуты, и представляется, что попытка сконструировать та-

кую шкалу не будет иметь большого значения.

Шкалы Лайкерта

Шкалы Лайкерта состоят из утверждений, за которыми следуют

пяти- или семибалльные рейтинговые шкалы, указывающие степень

согласия испытуемого с этими утверждениями. Поскольку при шка-

лировании такого типа предполагается только то, что отдельные за-

дания монотонно связаны с измеряемым аттитюдом, а сумма показа-

телей по заданиям линейно связана с ним, очевидно, что в шкалиро-

вании по Лайкерту нет никаких недопустимых предположений.

Однако, я не намерен уделять много внимания конструированию

шкал Лайкерта, поскольку этот тип шкал аттитюдов ничем сущест-

венно не отличается от стандартного личностного опросника, пол-

учаемого путем коррелирования каждого задания с общим показате-

лем. Другими словами, модель, основанная на шкалах Лайкерта,

описывается классической теорией измерения, а тесты лучше всего

конструировать при помощи методик анализа заданий, обсуждав-

шихся ранее. Их дискриминативность является следствием самой

сути заданий - утверждений, относящихся к аттитюдам - и формы

заданий; шкала, указывает степень согласия испытуемого с утверж-

дением.

ШАГИ КОНСТРУИРОВАНИЯ

Здесь будут обсуждены только те моменты, в которых есть какие-

либо существенные различия с процедурами, описанными ранее.

Задания. При шкалировании аттитюдов важно точно указать объ-

ект. В нашем примере мы возьмем аттитюд к евреям (автор надеется

на то, что поскольку он сам является евреем, это позволит избежать

любых обвинений в антисемитизме: никакого умышленного антисе-

митизма в этом примере нет). Вначале соберем все утверждения,

относящиеся к евреям. Крайних утверждений, как положительных,

так и отрицательных, следует избегать, так как в нормальной попу-

ляции (категории обследуемых) многие такие задания покажут сла-

бый разброс и будут в этом случае подвержены влиянию установки

на социально желательные ответы. Аналогично, нейтральные зада-

ния также покажут небольшой разброс. Следовательно, целью будет

найти утверждения, которые являются умеренно положительными

или умеренно отрицательными. Тест должен будет содержать, чтобы

он выглядел более реалистично и его цель была не так очевидна,

примерно половину положительных и половину отрицательных ут-

159

верждений. Этот баланс будет полезен для преодоления установки на

согласие. Приведем несколько заданий в качестве примера;

(1) Евреи внесли значительный вклада современную науку (уме-

ренно положительное)

(2) Без евреев современная наука отстала бы на много лет (поло-

жительное, слишком крайнее)

(3) Евреи склонны держаться вместе как обособленный клан (от-

рицательное, умеренное)

(4) Евреи просочились почти во все важные организации (нега-

тивное, слишком крайнее)

(5) Евреи - это фактически высшая, избранная раса (положи-

тельное, слишком крайнее)

(6) Евреи обычно связаны с деньгами и материальными ценностя-

ми (негативное, слишком крайнее)

Форма задания. Как было описано, для шкалы Лайкерта необхо-

димы пяти- или семибалльные рейтинговые шкалы, указывающие

степень согласия с каждым утверждением. У Nunnally (1978) можно

найти полное обсуждение того, как правильно использовать рейтин-

говые шкалы. В кратком изложении можно сказать, что:

(а) Задания с графическими шкалами легче выполнять и они

приводят к меньшему количеству ошибок, чем задания с числовыми

шкалами.

Пример графической шкалы:

Полностью

несогласен

В случае числовой шкалы слова-комментарии указываются рядом

с числами.

(б) Надежность возрастает с увеличением количества градаций

шкалы, и это возрастание резко обрывается после 7. Это говорит в

пользу семибалльной шкалы.

(в) При нечетном количестве градаций результаты несколько от-

личаются от результатов для шкал с четным количеством градаций.

Однако, нечетное количество градаций позволяет использовать ней-

тральный (средний) ответ, который в шкалах аттитюдов представля-

ется полезным (хотя он может породить уже известную установку на

ответ).

Таким образом, имея задания, основанные на утверждениях о

евреях, и семибалльные рейтинговые шкалы степени согласия с эти-

ми утверждениями, мы уже готовы испытать наши задания и подвер-

гнуть их процедуре анализа.

160

Анализ заданий. Для анализа заданий должна использоваться

большая и репрезентативная выборка, отражающая ту часть населе-

ния, для которой разрабатывается этот тест. Идеальным было бы

обследовать в десять раз больше испытуемых, чем есть заданий в

тесте, однако можно использовать и две большие выборки (в каждой

более 100 испытуемых).

Как и при анализе заданий для личностных опросников, каждый

вопрос должен коррелировать с общим показателем по тесту. Чтобы

добиться этого, для отрицательных утверждений оценка показателей

должна быть подвергнута так называемому обращению. Покажем это

на примере.

( 1 ) Евреи склонны держаться вместе замкнутым кланом (отрица-

тельный аттитюд)

(2) Евреи - высококультурная группа в европейском сообществе

(положительный аттитюд)

Для задания 1 показатель равен 8 (количество градаций шкалы

плюс 1) минус реальное значение, отмеченное испытуемым; а для

задания 2 показатель равен реальному значению, отмеченному на

шкале. Общий показатель для каждого испытуемого, отражающий

его позицию по переменной «положительный аттитюд к евреям»,

состоит из суммы показателей, полученных по заданиям.

Шаги по обработке результатов следующие:

(1) Подсчитайте показатели для каждого задания, принимая во

внимание обращение для негативных заданий, как описано для зада-

ний 1 и 2 выше.

(2) На основе показателей по заданиям вычислите общий показа-

тель для каждого испытуемого.

(3) Вычислите коэффициента (см. гл.5, стр. 173).

(4) Вычислите корреляцию каждого задания с общим показате-

лем, используя формулу произведения моментов Пирсона.

(5) Отберите задания, для которых выполняется критерий корре-

ляции (в обоих случаях, если используются две формулы).

(6) Если возможно, используйте равное количество положитель-

ных и отрицательных заданий.

(7) Вычислите коэффициент а. для нового теста из отобранных

заданий.

(8) Следует стремиться к шкалам из 20 заданий, как указано в

главе 6 (см. стр. 197), со значением коэффициента а 0.60 или выше.

(9) Если необходимо, переформулируйте некоторые задания и

подвергните их вновь анализу.

4-196

(10) Апробируйте и подвергните анализу заданий окончательно

отобранную шкалу.

(II) Заданиям следует приписать весовые коэффициенты в соот-

ветствии с их корреляцией с общим показателем. Однако, как указы-

вает Nunnally, корреляция шкал, в которых используются весовые

коэффициенты, и шкал без них так велика, что, как оказывается, не

стоит утруждать себя вычислением этих весовых коэффициентов.

(12) Валидизируйте переменную теста при помощи соответству-

ющих экспериментальных приемов.

Вероятно, нет никаких сомнений в том, что в результате этих

процедур будет получено однородное и с признаками очевидной ва-

лидности средство измерения аттитюда к евреям, для которого про-

цедурами шага 12 будет продемонстрировано, валидно оно или нет.

Заслуживает внимания еще один момент. Когда используются

многобалльные шкалы, разброс заданий всегда больше, чем в случае

с дихотомическими заданиями. Следовательно, факторный анализ

заданий шкалы Лайкерта с гораздо большей вероятностью может

привести к четкой факторной структуре чем для личностных опрос-

ников, в которых используется дихотомический подсчет показате-

лей. Следовательно, имеет смысл подвергать корреляции между за-

даниями факторному анализу и выбирать те задания, которые насы-

щают факторы. Процедуры и логические основания для факторного

анализа заданий при конструировании тестов уже полностью обсуж-

далось, поэтому здесь будут только кратко указаны необходимые

шаги.

(1) Как для анализа заданий.

(2) Как для анализа заданий.

(3) Как для анализа заданий.

(4) Вычислите корреляционную матрицу для всех заданий (по

формуле произведения моментов Пирсона).

(5) Подвергните корреляционную матрицу факторному анализу

с вращением.

(б) Отберите задания, нагруженные генеральным фактором или

другими факторами (см. пункт «Замечания» ниже).

(7) Проведите тестирование с отобранными заданиями и проверь-

те результаты.

(8) Валидизируйтетесттакже, каквшаге 12анализазаданий (см.

выше).

ЗАМЕЧАНИЯ

Для факторного анализа желательна настолько большая выборка,

насколько возможно. Если размер выборки не больше утроенного

162

числа заданий теста, то обязательно необходимы повторные испыта-

ния.

В шкалах аттитюдов может присутствовать генеральный фактор:

в нашем примере это аттитюд к евреям. Однако, можно возразить,

что этот аттитюд сам зависит от таких факторов, как догматизм

(Rokeach, 1960), авторитарные черты личности (АсЗогпоидр., 1950),

или от личностных факторов, таких как фактор Кэттелла L - подо-

зрительность. Если это так, тогда факторная структура шкалы атти-

тюдов не будет явно выраженной, и любой генеральный фактор мог

бы проявляться только в факторах второго или даже более высокого

порядка. По этой причине факторный анализ как метод конструиро-

вания тестов должен использоваться только тогда, когда есть веские

основания a priori предположить наличие явно выраженного гене-

рального фактора или другой подобной структуры.

Краткий обзор и заключение

(1) Определены объективные тесты и указаны их преимущества.

(2) Предложена таксономия тестов, основывающаяся на двух па-

раметрах: стимульно-инструктивной ситуации и особенностях оце-

нивания ответов. Это позволяет разработчику тестов конструировать

разнообразные формы заданий.

(3) Проведено различие между объективными тестами способно-

стей, темперамента и динамики.

(4) Сформулированы некоторые практические советы по констру-

ированию объективных тестов, прежде всего тестов личности и моти-

вов.

(5) Обсуждены пути преодоления трудностей при разработке тес-

тов.

(6) Обсуждены специфические проблемы объективных тестов ди-

намики.

(7) Приведен список основных принципов конструирования тес-

тов мотивов, основывающийся на психологических публикациях.

(8) Обсуждены различия между тестированием силы мотивов и

целей.

(9) Описано конструирование проективных тестов, после доказа-

тельства значимости разработки таких тестов.

(10) Кратко обсуждено конструирование других тестов мотивов.

(II) Описано конструирование шкал настроений.

(12) Обсуждено конструирование тестов Лайкерта.

Дата добавления: 2018-02-18; просмотров: 485; Мы поможем в написании вашей работы!

Поделиться с друзьями:

⇐ Предыдущая 6 7 8 9 101112 13 14 15 Следующая ⇒

Мы поможем в написании ваших работ!