БЛИЗНЕЦОВЫЕ        ИССЛЕДОВА-



НИЯ — метод установления сходства
близнецов для оценки относительной
роли наследственности и среды в появ-
лении межиндивидуальных вариаций
измеряемого признака. При этом сравни-
вают степень внутрипарного сходства ге-
нетически идентичных монозиготных
(МЗ) и неидентичных дизиготных (ДЗ)
близнецов. Начало Б. и. положено тру-
дами Ф. Гальтона (1876). Предполагается
примерное равенство постнатальных воз-
действий среды на близнецов, входящих
как в МЗ, так и в ДЗ пару. Из этого сле-
дует, что если по какому-либо признаку
МЗ близнецы оказываются более сходны-
ми, чем ДЗ, то это означает формирова-
ние данного признака под влиянием гено-
типа. Если интересующий исследователя
признак формируется под влиянием вне-
шних воздействий, то внутрипарное сход-
ство МЗ и ДЗ близнецов должно быть по-
чти полным.

Помимо данного метода, получившего
название метода контрастных групп, в
Б. и. используются и другие: метод конт-
рольного близнеца, метод разлученных
МЗ близнецов и метод близнецовой пары
(Р. Заззо, 1960,1962; И. В. Равич-Щербо,
1978). Эти методы могут быть дополнены
сопоставлением близнецов с людьми дру-
гих степеней родства и не находящимися
в родстве. Наибольшее значение имеет
изучение МЗ близнецов, разлученных в
раннем детстве и, следовательно, воспи-
тывающихся в разной среде. Это создает
почти идеальные условия для Б. и. В пси-
ходиагностике Б. и. посвящены прежде
всего изучению проблемы «генотип—сре-
да» применительно к интеллекту, изме-
ренному с помощью тестов (см. Тесты
интеллекта).
В большинстве иссле-
дований отмечается большее внутри-
парное сходство различных функций
интеллекта у МЗ близнецов, чем у ДЗ

26


близнецов (Л. Эрленмайер-Кимлинг и
Л. Ярвик, 1963 и др.). Однако в этих ис-
следованиях не учитывается ограничен-
ность Б. и., связанная с некорректностью
допущений одинакового воздействия
среды на членов МЗ и ДЗ близнецовых
пар. МЗ близнецы уже на ранних этапах
онтогенеза благодаря большому сомати-
ческому сходству имеют более сходный
тип активности; чаще у них общие друзья,
окружающие стимулируют их идентич-
ность и т. д. Иначе говоря, у них суще-
ствуют и средовые условия для конвер-
гентного психического развития (И. В. Ра-
вич-Щербо, 1978, 1981). Подвергнутые
тщательному критическому анализу ис-
следования рано разлученных членов МЗ
пар также оказались не вполне состоя-
тельными. Близнецы, хотя и были разлу-
чены, как правило, воспитывались в сход-
ных социально-психологических услови-
ях (Л. Кэмин, 1974; И. В. Равич-Щербо,
1978). Таким образом, методические
ошибки, допускаемые при сопоставлении
результатов изучения МЗ близнецов, вос-
питывавшихся отдельно друг от друга
(а сюда относится не только пренебреже-
ние тщательным анализом среды, но и,
напр., сравнение данных, полученных в
различных возрастных группах, использо-
вание нестандартизированных тестов),
заставляют усомниться в обоснованности
выводов этих исследований. Тем самым
ставятся под сомнение зарубежные тео-
рии, исходящие из генетической обуслов-
ленности интеллекта.

Необходимо признать, что возможно-
сти Б. и. не столь велики, как это счита-
лось долгое время, и заметно снижаются
при переходе от исследования антропо-
метрических и физиологических призна-
ков к психологическим. С такой позиции
следует оценивать и результаты выпол-
ненных за рубежом работ, в которых изу-
чалось влияние генотипа на параметры


БРЭ


экстра—интроверсии, нейротизма и дру-
гие личностные особенности. В нашей
стране Б. и. в психодиагностике единичны
(Н. С. Кантонистова, 1980). Значительно
шире они используются в психофизиоло-
гии, медицине.

БРЭЙСА МОТОРНЫХ СПОСОБНОС-
ТЕЙ ТЕСТЫ
(Brace Motor Ability Tests
(Scale) — тестовая батарея исследова-
ния уровня развития двигательных уме-
ний, компонентов моторики детей и под-
ростков. Предложена в 1927 г. Д. Брэйсом,
профессором физического воспитания Те-
хасского университета (США). Методика
имеет шкальный принцип построения (см.
Бине—Симона умственного развития
шкала, Станфорд—Бине умственного
развития шкала).

Шкала разработана в двух вариантах,
включающих соответственно 20 и 30 тес-
тов, допускается как индивидуальное, так
и групповое обследование детей и подро-
стков в возрасте от 10 до 16 лет, а также
взрослых в возрасте до 45 лет. Приводим
примеры заданий Б. м. с. т.:

Тест 1. Пройти по прямой линии, ста-
вя носок одной ноги вплотную к пятке
другой ноги. Упражнение начать с левой
ноги. Сделать 10 шагов. При выполнении
задания глаза испытуемого открыты, до-
пускается балансирование руками. Тест
считается невыполненным, если испыту-
емый потерял равновесие и сошел с пря-
мой линии либо при несоблюдении усло-
вия прикосновения носка одной ноги к
пятке другой.

Тест 11. Подпрыгнуть и во время
прыжка хлопнуть обеими руками по пят-
кам. Тест считается невыполненным, если
испытуемый не смог прикоснуться од-
новременно к обеим пяткам.

Тест 20. Стать на левую ногу. Пра-
вую ногу вытянуть вперед. Опуститься и
сесть на левую ногу, не прикасаясь пра-


вой ногой или руками к полу. Подняться
из такого положения, не теряя равнове-
сия. Тест считается невыполненным, если
испытуемый не смог присесть на левую
ногу, прикоснулся правой ногой или рука-
ми к полу, не смог подняться на левой но-
ге без прикосновения правой ноги к полу.

Процедура обследования стандарти-
зирована. Методические материалы по
тесту снабжены фотографиями, демон-
стрирующими правильное выполнение
движений. Продолжительность обследо-
вания 35-40 мин. При оценке результа-
тов обследования сырые баллы (см. Оцен-
ки первичные),
соответствующие числу
выполненных тестов, по специальным
таблицам переводятся в стандартные по-
казатели моторного развития (ПМР).

По мнению Д. Брэйса, основными фун-
кциями, подлежащими измерению при
оценке моторного развития, являются:
ловкость движений, гибкость, мышечная
сила, способность к сохранению равнове-
сия и координация сложных движений.
При отборе заданий, вошедших в Б. м. с. т.,
автор руководствовался следующими
принципами: преимущественная направ-
ленность на врожденные качества мото-
рики, а не на двигательные навыки; моде-
лирование сложных двигательных комп-
лексов, а не отдельных движений; широ-
кий охват наиболее типичных комплексов
движений; доступность шкалы для массо-
вого использования.

Б. м. с. т. стандартизированы на вы-
борке 155 детей и взрослых. Полная фор-
ма теста (из 30 заданий) имеет два парал-
лельных варианта (формы А и В). Сокра-
щенная шкала (20 заданий) имеет также
две формы (тесты 1-10 — форма М, тес-
ты 11-20 — форма Н). При оценке харак-
теристик Б. м. с. т. как диагностической
процедуры валидность конструктная
определялась на основе сравнения пока-
зателей моторного развития с экспертны-

27


БРЭ


ми оценками 75 преподавателей. По раз-
личным критериям (см. Валидизации
критерий)
коэффициент корреляции со-
ставил 0,58—0,68. Среди критериев экс-
пертных оценок были: «способность к
легкому усваиванию форм движений»,
«разнообразие движений», легкость слож-
ных движений» и др. Валидность теку-
щая
проверялась на материале контраст-
ных групп детей, интенсивно занимаю-
щихся спортом и не занимающихся


спортом. Коэффициент надежности ре-
тестовой
составил 0,78-0,90, надежно-
сти параллельных форм
(формы Л,
В) — 0,73.

На разработку Б. м. с. т. существен-
ное влияние оказала Озерецкого оценки
моторики шкала.
Б. м. с. т. переведена
на русский язык Е. В. Гурьяновым в
1928 г.

Сведений об использовании в СНГ не
имеется.


в


«В ТРИДЕВЯТОМ ЦАРСТВЕ» ТЕСТ

(The «Once Upon a Time» Test) — проек-
тивная методика
исследования личнос-
ти. Предназначена для оценки у детей
способности испытывать эмоции тревоги
и удовольствия. Предложена Т. Фагула в
1994 г. Испытуемому предъявляют 9 ри-
сунков-сцен из мультфильмов и просят
упорядочить их и составить рассказ. Ре-
зультаты оценивают в соответствии с ре-
акцией испытуемого на тестовые ситуа-
ции, изменчивостью выбора картинок,
частотой выбранных сцен, что выражает
чувства тревоги или удовольствия, а так-
же последовательность размещения сцен.
Сообщаются данные о валидности теста
на выборке из 5-10-летних детей. Дан-
ные, полученные по тесту, используются
для дифференциации нормальных, агрес-
сивных, тревожных или изолированных
детей. Сообщается о достаточно высокой
валидности и надежности методики.

Сведений об использовании в СНГ не
имеется.

ВАЙНЛЕНДСКАЯ СОЦИАЛЬНОЙ
ЗРЕЛОСТИ ШКАЛА
(Vineland Social
Maturity Scale) — методика определения
степени овладения социальными навыка-


ми, предназначена для детей в возрасте от
3 до 9 лет. Разработана Е. А. Доллом в
1935 г.

Автор исходил из понимания социаль-
ных навыков как свойств, присущих всем
людям, «как общих предпосылок уровня
наблюдаемой активности индивида, име-
ющей социальное значение». Эта актив-
ность проявляется в первую очередь в
способности следить за своими потребно-
стями и ощущать ответственность за свои
действия. Комплекс этих атрибутов
Е. Долл обозначил как «социальная зре-
лость».

Сущность тестирования состоит в опи-
сании активности ребенка и соотнесении
конкретных форм его поведения с норма-
тивами. Экспериментатор получает в ходе
беседы сведения о ребенке и затем оцени-
вает их по стандартной схеме. Примене-
ние шкалы не требует участия испытуемо-
го, данные чаще всего получают от других
лиц, обладающих информацией о его раз-
витии (родители, воспитатели и т. д.).
Ориентиром для беседы и оценки дей-
ствий является бланк для ответов, кото-
рый содержит 36 пунктов, касающихся
поведения ребенка. Пункты сформулиро-
ваны таким образом, чтобы выявить, спо-


29


ВАЛ


собен ли ребенок самостоятельно удов-
летворить свои потребности в соответ-
ствии с нормативными требованиями для
данного возраста. В первую очередь нор-
мативы касаются «социальных способно-
стей», например: самостоятельность, спо-
собность к общению, социальная вклю-
ченность и т. д. Формулировка нормати-
вов примерно такова:

— для возраста 3-4 года: сам застегива-
ет одежду, сам одевается, кроме завя-
зывания шнурков;

— для возраста 4-5 лет: играет в про-
стые настольные игры, имеет пред-
ставление о деньгах и их значении.
Нормативы объединяются в следую-
щие категории: 1. Способность к само-
обслуживанию; 2. Самостоятельность во
время еды; 3. Самостоятельность при оде-
вании; 4. Способность к саморегуляции
поведения; 5. Уровень активности; 6. Уро-
вень общения; 7. Физическая активность;
8. Степень социализации.

Беседа как форма получения информа-
ции от лиц, знающих ребенка, оказывает-
ся вполне адекватной для определения
степени овладения социальными навыка-
ми, но предъявляет повышенные требова-
ния к экспериментатору, который должен
уметь выделить сведения, относящиеся к
нормативным показателям. Выполнение
каждого нормативного требования оцени-
вается в 1 балл. Оценка первичная с
учетом хронологического возраста пере-
водится в условный показатель, позволя-
ющий отнести испытуемого к определен-
ной «зоне развития». В каждой возраст-
ной категории выделяется пять таких зон.

Исходя из характера тестовых заданий
методика пригодна для обследования лиц
от рождения до 25 и даже до 30 лет. Одна-
ко из-за отличий в культурных условиях
в разных возрастных выборках автор оп-
ределил зону применимости шкалы от 3
до 9 лет (хотя стандартизация ее прово-
дилась на испытуемых в возрасте от не-
скольких месяцев до 11 лет). Для обсле-


дования детей в возрасте до 3 лет реко-
мендуется использовать шкалу развития
Гезелла (см. Психодиагностика ранне-
го детства).
В процессе рестандартиза-
ции шкалы (Й. Кожены, 1974) была уста-
новлена внутренняя согласованность
заданий (коэффициенты для отдельных
возрастных категорий находились в диа-
пазоне от 0,59 до 0,86).

Возможности использования шкалы
достаточно широки. Она может быть с ус-
пехом применена в детской клинической
психодиагностике, при контроле развития
детей младшего возраста.

Данных об использовании в СНГ нет.

ВАЛИДИЗАЦИИ КРИТЕРИЙ — не-
посредственная и независимая от вали-
дизируемого теста мера психического
свойства, на исследование которого на-
правлена психодиагностическая методи-
ка. Сравнение результатов теста с В. к.
является непременным условием проце-
дуры определения валидности критери-
альной.

В качестве В. к. на практике обычно
используют:

— объективные социально-демографи-
ческие и биографические данные
(стаж, образование, профессия, прием
или увольнение с работы);

— показатели успеваемости, чаще всего
являющиеся критериальной мерой те-
стов способности к обучению, дости-
жений в отдельных дисциплинах, те-
стов интеллекта;

— производственные показатели эффек-
тивности выполнения отдельных ви-
дов профессиональной деятельности,
имеющие наибольшее значение при
валидизации методик, используемых в
профотборе и профориентации;

— результаты реальной деятельности (ри-
сование, моделирование, музыка, со-
ставление рассказа и т. д.) при испы-
тании тестов общих и специальных
способностей, тестов личности;


30


ВАЛ


— врачебный диагноз или другие заклю-
чения специалиста;

— контрольные испытания знаний и уме-
ний;

— данные других методик и тестов, ва-
лидность
которых считается установ-
ленной.

Среди многообразия видов В. к. мож-
но в самом общем виде выделить объек-
тивные (относительно независимые от
субъективных мнений, оценок людей) и
субъективные критерии. Последние в
психодиагностике используются более ча-
сто. К числу таких критериев относятся
оценки, суждения, заключение об объек-
те исследования, сделанные экспертом
(специалистом, педагогом, руководите-
лем, психологом). При таком методе ин-
дивидуальной оценки эксперт дает заклю-
чение на основе предложенной ему разра-
ботчиком теста оценочной шкалы. Объек-
тивизация В. к. достигается увеличением
числа экспертов.

Использование экспертных оценок в
качестве В. к. включает четыре возмож-
ных метода проведения процедуры вали-
дизации: коллективная оценка, средне-
взвешенная оценка, ранжирование, пар-
ное сравнение.

При коллективной оценке эксперты
совместно оценивают объект с помощью
оценочной шкалы. Выбор оценочных
шкал чаще всего осуществляется по прин-
ципу наибольшего удобства для эксперта.
Так, педагогам удобней оценить учащих-
ся по 5-балльной шкале. Условием кол-
лективной оценки является выработка об-
щего компромиссного мнения. При таком
способе оценивания результат весьма за-
висим от личностных особенностей и ха-
рактера группового взаимодействия экс-
пертов.

Распространенным методом получе-
ния В. к. является метод средневзве-
шенной оценки.
В этом случае каждый
испытуемый оценивается несколькими
экспертами, так что оценки, данные ис-


пытуемому одним экспертом, неизвест-
ны другим. Затем полученные оценки ус-
редняются.

Вместо оценочной шкалы можно при-
менить метод ранжирования, заключа-
ющийся в том, что несколько экспертов
независимо друг от друга или совместно
распределяют всех членов выборки на
группы по степени выраженности оцени-
ваемого признака. Полученные ранговые
места при независимом оценивании могут
быть также усреднены.

При определении рангового места
или оценке по шкале нередко эксперты
встречаются с трудностью соотнесения
выраженности признака с тем или иным
уровнем или положением на шкале. Эта
трудность возрастает при оценивании
малодифференцированных признаков
или при низкой квалификации экспер-
тов. В этом случае определенными пре-
имуществами обладает метод парного
сравнения.
Задача экспертов состоит в
попарной расстановке субъектов по по-
зициям альтернативных признаков («об-
щительный—замкнутый» или выражен-
ность большая—меньшая предложенно-
го для оценки качества и т. п.). Субъек-
тивно задача экспертов облегчается бла-
годаря отсутствию количественной
оценки качеств субъекта. Показателем
места, занимаемого испытуемым в ряду
других, служит общее число предпочте-
ний этого суббъекта по сравнению с ос-
тальными по данным всех экспертов.
Этот показатель может быть приведен к
числу экспертов и числу сравниваемых
испытуемых и вычислен в процентах.
Для расчета применяется формула
Дж. Гилфорда

00,

где В — число предпочтений, N — число
экспертов, п — количество сравнивае-
мых объектов.


31


ВАЛ


Выбор В. к. является ответственным и
важным этапом конструирования теста и
его валидизации. Чем более сложным,
комплексным является изучаемое психи-
ческое явление, тем шире, обобщеннее,
должен быть критерий. Напр., при обосно-
вании теста на общий интеллект в каче-
стве В. к. может выступать эффектив-
ность учебной, производственной или на-
учной деятельности в целом; при вали-
дизации методики для исследования экст-
раверсии—интроверсии — экспертные
оценки таких личностных характеристик,
как общительность, жизнерадостность,
социальная ответственность и др. Более
узкие и частные критерии применяются
для обоснования тестов, направленных на
измерение уровня развития конкретных
профессиональных знаний, умений, навы-
ков, напр.: мануальной ловкости, памяти
на числа и т. д. Узость выбираемого кри-
терия определяется областью психологи-
ческих явлений, охватываемых тестом,
однородностью (гомогенностью) задач ме-
тодики, конкретностью, однозначностью
интерпретации результатов. Напротив,
чем шире В. к., тем разнородней (гетеро-
геннее) по характеру могут быть задачи
теста и тем менее однозначна интерпрета-
ция результатов.

В реальной практической деятельнос-
ти успех или неуспех человека в любой
области определяется не каким-нибудь
изолированным фактором, а их комплек-
сом. Поэтому в принципе каждый В. к. яв-
ляется многокомпонентным. Для адекват-
ной оценки объекта его следует считать
комплексным, составным, что не только
расширяет сферу реальной валидизации,
но и делает ее результаты более точными
и обоснованными. Разделение критерия
на элементы в соответствии с элементами
изучаемого тестом сложного качества, об-
ласти поведения осуществляется при ха-
рактеристике синтетической валидности
(см. Валидность критериальная). Ана-


лиз и интерпретация связи тестовых оце-
нок с В. к. опирается на количественные
и качественные методы и вместе с выбо-
ром критерия является ключевым аспек-
том, определяющим достоверность харак-
теристики валидности теста (см. Валид-
ности коэффициенты).

ВАЛИДНОСТИ КОЭФФИЦИЕН-
ТЫ
— статистические показатели ва-
лидности эмпирической
теста.

В качестве меры валидности наиболее
часто на практике применяются разные
виды корреляционного анализа связи
между индивидуальными оценками по те-
сту и оценками по валидизации крите-
рию
(либо связь между результатами ва-
лидизируемого теста и эталонной методи-
ки). В большинстве случаев распределе-
ние тестовых оценок в репрезентативной
выборке валидизации близко к нормаль-
ному.
Оценки по критерию чаще бывают
дихотомическими, ранговыми (см. Шка-
лы измерительные)
или распределяются
по закону, отличному от нормального. Ес-
ли оба ряда переменных (тестовые и кри-
териальные оценки)носят континуальный
характер, используют коэффициент кор-
реляции произведения моментов Пирсона
(см. Корреляционный анализ). В зависи-
мости от шкалы представления перемен-
ных в сравниваемых рядах применяют те
или иные методы корреляционного анали-
за (см. Корреляция качественных при-
знаков. Корреляция бисериальная, Кор-
реляция ранговая).

Наряду с В. к., определяемыми тради-
ционным способом, существуют и некото-
рые другие меры количественной оценки
валидности теста, в частности с помощью
/-коэффициента, предложенного Э. При-
мовым (Е. S. Primoff, 1975). /-Коэффици-
ент является одним из методов характери-
стики синтетической валидности (см. Ва-
лидность критериальная).
Процедура
его определения предусматривает нали-


32


ВАЛ


чие перечня элементов сложной деятель-
ности или способности, выраженных
языком профессиональных или других
специальных действий, и экспертной
оценки относительной значимости этих
элементов для осуществления данной
сложной деятельности. Окончательный
анализ проводится на базе корреляции
оценок теста и отдельных элементов ре-
альной деятельности с учетом их удель-
ных весов. Статистическая обработка ос-
нована на применении уравнения множе-
ственной регрессии. Для каждого элемен-
та деятельности его корреляция с деятель-
ностью в целом умножается на «вес» в те-
сте, и полученные произведения суммиру-
ются по всем элементам деятельности.

В. к. являются важными, но далеко не
определяющими и не исчерпывающими ха-
рактеристиками валидности методики. В. к.
являются лишь элементом в сложном про-
цессе характеристики валидности теста.

Приблизительность отдельно вычис-
ленного В. к. обусловлена многими фак-
торами. Во-первых, условия валидности
теста не представляется возможным оп-
ределить полностью. Всегда остается мно-
жество неучтенных факторов, ситуаций,
условий и т. д. Во-вторых, логика крите-
риальной валидизации предполагает ва-
лидность самого критерия. Проверка та-
кой валидности представляет собой весь-
ма трудную проблему. К тому же очень ча-
сто тесты валидизируются относительно
доступного, а не наиболее соответствую-
щего1 критерия. Так, тесты интеллекта
сопоставляются с показателями академи-
ческой успеваемости, которая несомнен-
но связана с интеллектом, но его далеко
не исчерпывает. В-третьих, условия вали-
дизации по критерию предполагают, что
выборка полностью репрезентативна в по-
пуляции, для которой позже будут делать-
ся заключения. В реальной ситуации это
требование осуществить трудно, и репре-
зентативность выборки валидизации все-


гда требует дополнительной проверки
статистическими и качественными мето-
дами. На практике обычно весьма сложно
охватить адекватно большое количество
случаев, особенно при определении ва-
лидности прогностической.

Наибольшая сложность интерпрета-
ции В. к. с т. з. определяемой реальной ва-
лидности теста заключается в следую-
щем. Критериальная валидизация опира-
ется, как правило, на круг внешних для
психологии социально-прагматических
критериев. Это оправдывается тем, что
важнейшая цель валидизации — опреде-
ление практической ценности разрабаты-
ваемой методики. Критерии в этом случае
выступают как показатели, обладающие
непосредственной ценностью для опреде-
ленных областей практической деятель-
ности, напр.: «успеваемость», «производи-
тельность», «преступность», «состояние
здоровья» и т. д. При ориентации на эти
категории в ходе валидизации решаются
сразу две задачи: собственно задача изме-
рения валидности и оценка прагматичес-
кой эффективности психодиагностиче-
ской методики. Если получен значимый
коэффициент корреляции, то можно счи-
тать, что с той или иной степенью досто-
верности решены с позитивным результа-
том сразу две эти задачи. Но если корре-
ляция не обнаружена, то остается неопре-
деленность: либо не валидна сама проце-
дура (тестовый балл не отражает, напр.,
стрессоустойчивость оператора), либо не
верна гипотеза о наличии причинно-след-
ственной связи между психическим свой-
ством и социально ценным показателем
(стрессоустойчивость не влияет на про-
цент аварийных ситуаций).

Наряду с перечисленными теоретичес-
кими и методическими сложностями при-
менения и интерпретации В. к. необходи-
мо помнить и об обеспечении статистичес-
кой значимости рассчитываемых коэффи-
циентов. Делая вывод о валидности теста


33


ВАЛ


с привлечением В. к., нужно быть уверен-
ным в том, что данный коэффициент не
появился в результате случайных откло-
нений в выборке. Установив значимость
корреляции между тестовыми показателя-
ми и критерием, необходимо оценить вели-
чину стандартной ошибки тестовых оце-
нок. Применяемый при этом статистичес-
кий показатель ошибки измерения указы-
вает на допустимые пределы ошибки в ин-
дивидуальных показателях вследствие ог-
раниченной надежности теста. Анало-
гично ошибка в оценке указывает на допу-
стимые пределы возможной ошибки в про-
гнозируемой величине индивидуального
критериального показателя, возникающей
в результате ограниченной валидности те-
ста.

Ошибка оценки находится по формуле

где гху — коэффициент валидности, ау
стандартное отклонение критериальных

показателей. Величина J\-r£y указыва-
ет на величину ошибки относительно
ошибки простого угадывания, т. е. при ну-
левой валидности. Если М-г%у1, то
ошибка столь же велика, как и при угады-
вании. Если коэффициент валидности ра-
вен 0,80, то М-г^у = 0,60, т. е. доля оши-
бок составляет 60% таковой при случай-
ном распределении.

Особенности интерпретации В. к. как
статистических мер аналогичны другим
мерам связи.

ВАЛИДНОСТЬ (англ. valid — действи-
тельный, пригодный, имеющий силу) —
комплексная характеристика методики
(теста), включающая сведения об обла-
сти исследуемых явлений и репрезента-
тивности
диагностической процедуры по
отношению к ним.


В наиболее простой и общей формули-
ровке В. теста это «...понятие, указываю-
щее нам, что тест измеряет и насколько
хорошо он это делает» (А. Анастази,
1982). В стандартных требованиях к пси-
хологическим и образовательным тестам
(Standarts..., 1974) В. определяется как
комплекс сведений о том, относительно
каких групп психологических свойств
личности могут быть сделаны выводы с
помощью методики, а также о степени
обоснованности выводов при использова-
нии конкретных тестовых оценок или дру-
гих форм оценивания. В психологической
диагностике
В. — обязательная и наибо-
лее важная часть сведений о методике,
включающая (наряду с указанными выше)
данные о степени согласованности ре-
зультатов теста с другими сведениями об
исследуемой личности, полученными из
различных источников (теоретические
ожидания, наблюдение, экспертные оцен-
ки, результаты других методик, достовер-
ность которых установлена и т. д.), суж-
дение об обоснованности прогноза разви-
тия исследуемого качества, связь изучае-
мой области поведения или особенности
личности с определенными психологичес-
кими конструктами. В. описывает также
конкретную направленность методики
(контингент испытуемых по возрасту,
уровню образования, социально-культур-
ной принадлежности и т. д.) и степень
обоснованности выводов в конкретных
условиях использования теста. В сово-
купности сведений, характеризующих В.
теста, содержится информация об адек-
ватности применяемой модели деятельно-
сти с т. з. отражения в ней изучаемой пси-
хологической особенности, о степени од-
нородности заданий (субтестов), вклю-
ченных в тест, их сопоставимости при ко-
личественной оценке результатов теста в
целом.

Важнейшая составляющая В. — опре-
деление области изучаемых свойств —


34


ВАЛ


имеет принципиальное теоретическое и
практическое значение при выборе мето-
дики исследования и интерпретации ее
данных. Содержащаяся в названии теста
информация, как правило, недостаточна
для суждения о сфере его применения.
Это лишь обозначение, «имя» конкретной
процедуры исследования. В качестве при-
мера можно привести широко известную
корректурную пробу. Область изучае-
мых свойств личности включает устойчи-
вость и концентрацию внимания, психо-
моторную подвижность. Данная методика
позволяет получать оценки выраженнос-
ти этих психологических качеств у испы-
туемого, хорошо согласуется с показате-
лями, полученными другими методами и,
следовательно, обладает высокой В. На-
ряду с этим результаты выполнения кор-
ректурной пробы подвержены влиянию
большого количества других факторов
(нейродинамические особенности, харак-
теристики кратковременной и оператив-
ной памяти, индивидуальная переноси-
мость монотонии, развитие навыка чте-
ния, особенности зрения и т. д.), по отно-
шению к которым методика не является
специфичной. В случае применения кор-
ректурной пробы для их измерения В. бу-
дет невелика или сомнительна.

Таким образом, очерчивая сферу при-
менения методики, В. отражает и уровень
обоснованности результатов измерения.
Очевидно, что при небольшом количестве
сопутствующих факторов, влияющих на
результат исследования, а значит, при их
незначительном воздействии на резуль-
тат теста достоверность тестовых оценок
будет выше. Еще в большей степени дос-
товерность данных теста определяется на-
бором измеряемых свойств, их значимос-
тью для осуществления диагностируемой
сложной деятельности, полнотой и су-
щественностью отражения в материале
теста предмета измерения. Так, чтобы
удовлетворить требованиям В., диагнос-


тическая методика, предназначенная для
профотбора, должна включать анализ ши-
рокого круга нередко различных по своей
природе показателей, наиболее важных
для достижения успеха в данной профес-
сии (уровень внимания, особенности па-
мяти, психомоторика, эмоциональная ус-
тойчивость, интересы, склонности и т. д.).
Как видно из вышеизложенного, в по-
нятие В. входит большое количество са-
мой разнообразной информации о тесте.
Различные категории этих сведений и
способы их получения образуют типы В.
Диагностическая (конкурентная) В.
отражает способность теста дифференци-
ровать испытуемых по изучаемому при-
знаку. Анализ диагностической В. имеет
отношение к установлению соответствия
показателей теста реальному состоянию
психологических особенностей испытуе-
мого в момент обследования (см. Валид-
ность текущая).
Примером определения
этого типа В. может быть исследование по
методу контрастных групп. Проведение
теста интеллекта у нормально развиваю-
щихся детей и их сверстников с наруше-
ниями в интеллектуальном развитии мо-
жет выявить глубокие количественные и
качественные различия в выполнении за-
даний сравниваемыми группами. Степень
надежности дифференциации детей пер-
вой и второй групп по данным теста будет
характеристикой диагностической В.
оценки умственного развития, получае-
мой с помощью данной методики.

Сведения, характеризующие степени
обоснованности и статистической надеж-
ности развития исследуемой психологи-
ческой особенности в будущем, составля-
ют валидность прогностическую мето-
дики. Заключение об этом типе В. может
быть получено, напр., путем сравнения
тестовых оценок в одной и той же группе
испытуемых спустя определенное время.
Основой прогностической В. является оп-
ределение того, насколько важен исследу-


35


ВАЛ


емый признак с т. з. деятельности испыту-
емого в будущем с учетом закономерно
изменяющихся обстоятельств, перехода
на другой уровень развития.

Большинство методик, особенно тес-
тов способностей и интеллекта, исследу-
ется на предмет диагностической и про-
гностической В. Два этих типа В. нередко
объединяют в понятие валидности эмпи-
рической.
Здесь подчеркивается общ-
ность подхода к их определению, который
осуществляется путем статистического
коррелирования баллов (оценок) по тесту
и показателей по внешнему параметру,
избранному в качестве валидизации кри-
терия (см. Валидность критериальная).
Критерий В. выступает в качестве меры,
показателя исследуемых психологиче-
ских особенностей. Так, тесты специ-
альных способностей
проверяются пу-
тем сопоставления с результатами обуче-
ния по другим предметам, достижениями
в музыке, рисовании и т. д. Тесты общих
интеллектуальных способностей валиди-
зируются сравнением с еще более широ-
кими характеристиками школьных дости-
жений (общая успеваемость, овладение
сложными системами знаний и навыков).
Критерий В. является независимым от те-
ста показателем, обладающим непосред-
ственной ценностью для определенных
областей практической деятельности.
Напр., в области педагогической психоло-
гии это «успеваемость», в психологии тру-
да — «производительность», в медицин-
ской психологии — «состояние здоровья»
и т. д. В качестве непосредственных кри-
териев часто используются экспертные
оценки и характеристики лиц, обследо-
ванных с помощью валидизируемого тес-
та, данные педагогами, сотрудниками, ру-
ководителями.

Во многих случаях бывает сложно или
невозможно подобрать адекватный крите-
рий валидизации. При этом особую важ-
ность приобретает комплекс характерис-


тик, входящих в тип теоретической В. При
разработке и использовании теста может
быть сформулирован ряд гипотез о том,
как будет коррелировать исследуемый
тест с другим тестом, измеряющим род-
ственные или противоположные психоло-
гические характеристики испытуемых.
Эти гипотезы выдвигаются на основании
теоретических представлений об измеря-
емых свойствах как о психологическом
конструкте. Подтверждение гипотез сви-
детельствует о теоретической обосно-
ванности методики, т. е. о степени ее
конструктной валидности. Этот тип В.
является наиболее сложным и комплекс-
ным. Для подтверждения соответствия
получаемых с помощью теста результатов
теоретическим ожиданиям и закономер-
ностям используется самая различная ин-
формация, в том числе и относящаяся к
другим типам В.

Валидность содержательная (внут-
ренняя, логическая) — комплекс сведе-
ний о репрезентативности заданий теста
по отношению к измеряемым свойствам и
особенностям. Одним из основных требо-
ваний при валидизации методики в этом
направлении является отражение в содер-
жании теста ключевых сторон изучаемо-
го психологического феномена. Если об-
ласть поведения или особенность очень
сложна, то содержательная В. требует
представления в заданиях теста всех важ-
нейших составных элементов исследуемо-
го явления. Так, при разработке теста
«вербального интеллекта» необходимо
ввести группы заданий (субтестов) для
проверки довольно разнородных по свое-
му операциональному составу навыков
письма и чтения.

Наряду с перечисленными основными
типами В. (содержательной, критериаль-
ной и конструктной) на практике выде-
ляют факторную, перекрестную (конвер-
гентную) и дискриминантную В. (см.
Валидность конструктная).


ВАЛ


Классификация типов В. в достаточной
мере условна, так как нередко для различ-
ных критериев В. применяются общие ме-
тоды определения, а с другой стороны,
одни и те же исходные данные могут ин-
терпретироваться с т. з. различных ти-
пов В. На рис. 9 приведена примерная схе-
ма, отражающая виды и связи валидности.

Факторная
Гомогенность
Одномерность


Конвергентная

Дискриминативная

Инкрементная


Валидность |
I

Рис. 9. Основные виды валидности

В психологической диагностике не су-
ществует универсального подхода к ха-
рактеристике В. Для валидизации каждо-
го вида психодиагностических процедур и
отдельных тестов могут применяться раз-
личные типы В. Сведения, входящие в
комплекс В., можно оценить качественно
и количественно (при помощи коэффици-
ента валидности), нередко их можно опи-
сать. Однако в силу сложности, комплекс-
ности, ситуативности по отношению к
конкретным условиям применения мето-
дики В. в целом невозможно измерить, о
ней можно лишь судить.

Реальная В. раскрывается только в ре-
зультате накопления значительного опы-
та работы с тестами. Получение новых,
расширенных данных о В. может ради-
кально изменить представление о сфере
приложения и эффективности методики.
Так, некоторые методики,разработанные


для диагностики вербальных факторов ин-
теллекта, с достаточной В. отражают
лишь уровень осведомленности. Сфера
применения теста в ходе его длительной
валидизации может быть, напротив, рас-
ширена. В качестве примера можно при-
вести Равена прогрессивные матрицы,
которые были разработаны для изучения
определенных сторон перцептивной де-
ятельности, однако оказались в значи-
тельной степени насыщены фактором, об-
щим для тестов интеллекта (см. Фак-
тор G).
Реальная В. ряда психодиагности-
ческих методик, особенно тестов интел-
лекта, достижений в обучении, професси-
ональной пригодности, опросников лич-
ностных
изменяется со временем. Это
объясняется устареванием возрастных
статистических норм, изменением соци-
альных норм и образцов поведения, мето-
дов обучения и содержания заданий, тре-
бований к профессиям. Данное обстоя-
тельство создает необходимость периоди-
ческого контроля В. методик.

ВАЛИДНОСТЬ ДИФФЕРЕНЦИАЛЬ-
НАЯ
^инвалидности конструктной,
рассматривающей внутренние взаимоот-
ношения между психологическими факто-
рами, диагностируемыми с помощью пси-
ходиагностической методики. Содержа-
ние В. д. может быть иллюстрировано на
примере тестов интересов, которые в сво-
ем большинстве обычно умеренно корре-
лируют с показателями общей академи-
ческой успеваемости,однако в различной
степени связаны с успеваемостью по от-
дельным дисциплинам. В. д. особенно важ-
на как показатель диагностической ценно-
сти методик, используемых в профотборе.

ВАЛИДНОСТЬ ИЛЛЮЗОРНАЯ (лож-
ная) — иллюзия соответствия заключе-
ния по результатам тестирования лично-
стным характеристикам обследуемого.
Возникает как следствие использования


ВАЛ


предельно общих, а поэтому применимых
практически ко всем обследуемым фор-
мулировок, таких, например, как «разум-
ный в выборе цели», «стремящийся к
лучшей жизни» и т. п. Такого рода утвер-
ждения принимаются почти всеми людь-
ми в качестве точного описания их лич-
ности, что создает почву для деятельнос-
ти различного рода прорицателей и пред-
сказателей. В. и. названа Барнума эф-
фектом
по имени Финиса Барнума, по-
пулярного организатора публичных зре-
лищ, говорившего, что «глупец рождает-
ся ежеминутно».

ВАЛИДНОСТЬ ИНКРЕМЕНТНАЯ

(англ. incremental — приращение, при-
быль) — один из компонентов критери-
альной валидности, прогностической
валидности
теста, отражающий практи-
ческую ценность методики при проведе-
нии отбора. В. и. может быть выражена
количественно при помощи валидности
коэффициента.

Показатель В. и. указывает на роль те-
ста в улучшении отбора лиц для реальной
деятельности, степень улучшения резуль-
тативности процедуры отбора по сравне-
нию с традиционной, основанной на ана-
лизе объективных сведений, документов,
бесед, приеме с испытательным сроком
и т. д.

В. и. рассчитывается в зависимости от
значений индекса отбора (доля поступив-
ших по отношению к числу претенден-
тов), коэффициента валидности теста, ба-
зового уровня (отношение между лицами,
справляющимися с критериальной дея-
тельностью, и случайной выборкой лиц).
При уменьшении индекса отбора значе-
ние коэффициента В. и. значительно по-
вышается при условии, что используемый
тест обладает высокой валидностью. Оп-
ределение величины коэффициента В. и.
производится с помощью специальных
таблиц (А. Анастази, 1982).


ВАЛИДНОСТЬ КОНСЕНСУСНАЯ

(consensual validity) — тип валидности,
основывающейся на установлении связи
(корреляции) тестовых данных с данны-
ми, полученными от внешних экспертов,
хорошо знакомых с теми лицами, которые
были подвергнуты тестированию. Поня-
тие и процедура В. к. введены Р. Мак-
Краэ в 1982 г. с целью обеспечения вали-
дизации опросников личностных, кото-
рая нередко затруднена (а иногда и невоз-
можна) в связи с отсутствием необходи-
мых для установления валидности крите-
риев.

ВАЛИДНОСТЬ КОНСТРУКТНАЯ

один из основных типов валидности, от-
ражающий степень репрезентации иссле-
дуемого психологического конструкта в
результатах теста. В качестве конструкта
могут выступать практический или вер-
бальный интеллект, эмоциональная неус-
тойчивость, интроверсия, понимание ре-
чи, переключаемость внимания и т. д.
Иначе говоря, В. к. определяет область те-
оретической структуры психологических
явлений, измеряемых тестом.

Поскольку проявления таких конст-
руктов, как, напр., интеллект в деятельно-
сти человека многообразны и неоднознач-
ны с т. з. их выделения, процедура уста-
новления В. к. по сравнению с валиднос-
тью критериальной
или валидностью
содержательной
сложна.

При объяснении связи полученных
тестовых результатов с теоретическим
конструктом необходимо постепенное на-
копление разнообразной информации о
динамике развития измеряемого свой-
ства, а также о его взаимодействии с дру-
гими психическими явлениями.

Среди конкретных методов характери-
стики В. к. в первую очередь необходимо
назвать сопоставление исследуемого на
предмет В. к. теста с другими методиками,
конструктное содержание которых извес-


38


ВАЛ


тно. Наличие корреляции между новым и
аналогичным по конструкту тестом ука-
зывает на то, что разрабатываемый тест
«измеряет» примерно ту же сферу поведе-
ния, способность, личностное качество,
что и эталонная методика. Такая процеду-
ра валидизации напоминает определение
критериальной валидности в том смысле,
что эталонный тест, валидность которого
определена, выступает в качестве незави-
симого критерия.

Следует, однако, заметить, что, в отли-
чие от критериальной валидизации, при
Анализе В. к. не требуется высокой степе-
ни связи результатов двух тестов. Если
Скажется, что новый и эталонный тесты
практически идентичны по содержанию и
результатам и разрабатываемая методика
не обладает преимуществами краткости
или легкости применения, это означает
лишь дублирование теста, оправданное
только с т. з. создания параллельной
формы теста.
Смысл процедуры В. к. со-
стоит в установлении одновременно как
сходства, так и различия психологичес-
ких феноменов, измеряемых новым тес-
том по сравнению с известным.

При анализе В. к. методики обычно
формулируют ряд гипотез о том, как будет
коррелировать разрабатываемый тест с
широким кругом других тестов, направ-
ленных на конструкты, находящиеся в те-
оретически известной или предполагае-
мой связи с исследуемыми. При этом В. к.
характеризуется не только связями про-
веряемого теста с близкородственными
показателями, но и с теми, где, исходя из
гипотезы, значимых связей наблюдаться
не должно. Эти подходы определяются
как конвергентная (проверка степени
близости прямой или обратной связи) и
дискриминантная (установление отсут-
ствия связи) валидизации. Подтвержде-
ние совокупности теоретически ожидае-
мых связей составляет важный круг све-
дений В. к. В англоязычной психодиагно-


стике такое операциональное определе-
ние В. к. обозначается как «предполагае-
мая валидность» (assumed validity).

Прямое отношение к характеристике
В. к. имеет факторный анализ, позволя-
ющий строго статистически проанализи-
ровать структуру связей показателей ис-
следуемого теста с другими известными и
латентными факторами, выявить общие и
специфические для группы сопоставляе-
мых тестов факторы, степень их представ-
ленности в результатах, т. е. определить
факторный состав и факторные нагрузки
результата теста. Исключительная важ-
ность такой процедуры является основа-
нием для выделения ее в особый вид
В. к. — факторную валидность.

Важным аспектом В. к. является
внутренняя согласованность, отражаю-
щая то, насколько определенные пункты
(задания, вопросы), составляющие мате-
риал теста, подчинены основному направ-
лению теста как целого, ориентированы
на изучение одних и тех же конструктов.
Анализ внутренней согласованности осу-
ществляется путем коррелирования отве-
тов на каждое задание с общим результа-
том теста. Следует отметить, что крите-
рий внутренней согласованности указы-
вает лишь на меру связи всего содержа-
ния теста с измеряемым конструктом, да-
вая лишь косвенную информацию о при-
роде измеряемого свойства.

При определении В. к. важное место
принадлежит изучению динамики измеря-
емого конструкта. При этом мы можем
опираться на гипотезы о его возрастном
развитии, влиянии тренировок, обучения,
освоения профессии и т. д. Одним из та-
ких подходов является применение крите-
рия возрастной дифференциации (см. Ва-
лидность по возрастной дифференциа-
ции),
что предусматривает согласование
результатов теста с ожидаемыми измене-
ниями, которые претерпевает изучаемое
психическое свойство в возрастной дина-


39


ВАЛ


мике при переходе на новый этап разви-
тия. Этот метод В. к. особенно важен для
валидизации тестов интеллекта, дос-
тижений в обучении.

В комплекс сведений о В. к. методики
входят также данные, относящиеся к сфе-
ре критериальной и содержательной ва-
лидности. Так, критерии, используемые
при валидизации, несут информацию, по-
зволяющую раскрыть область поведения,
качества, представленные в тесте в виде
конструкта. Для характеристики В. к. не-
обходимы связь с практическими форма-
ми деятельности, достоверность прогноза
реального поведения. Однако В. к. являет-
ся качественно более высоким и комплек-
сным уровнем описания теста, характери-
зуя область измеряемого поведения в ши-
роких психологических понятиях. Благо-
даря данным В. к. мы можем с психологи-
ческих позиций закономерно объяснить
результаты теста и их дисперсию, обосно-
вать диагноз, введя измеряемое свойство
в систему психологических категорий,
прогнозировать поведение в более широ-
ких пределах, чем это задается областью
деятельности, для которой определялась
содержательная валидность.

В качестве примера, иллюстрирующе-
го необходимость глубокого анализа тео-
ретического конструкта, лежащего в ос-
нове конкретной методики, для правиль-
ного применения теста и интерпретации
его результатов, можно привести сопос-
тавление двух популярных опросников
личностных «Проявления тревожнос-
ти» шкалы (MAS)
и варианта Айзенка
личностных опросников EPI.
Корреля-
ционные исследования показывают, что
шкала «тревожности» MAS положитель-
но коррелирует со шкалой «нейротизма»
и отрицательно — со шкалой «экстравер-
сии» EPI. С т. з. концепции Айзенка, эти
данные можно рассматривать как свиде-
тельство низкой валидности шкалы MAS:
«тревожность» коррелирует не только с


релевантным фактором «нейротизм», но и
с иррелевантным фактором «интровер-
сия». С этой т. з. MAS оказывается про-
сто нечувствительным к особой разновид-
ности «нейротизма» — нейротизму (тре-
вожности) экстравертов: из перечня пун-
ктов MAS исключены высказывания, в ко-
торых могла бы проявиться тревожность
экстраверта. Однако с теоретических по-
зиций К. Спенса и Дж. Тейлор, эта ситуа-
ция вполне закономерна, желательна и
никак не является артефактом — след-
ствием дефекта данного диагностическо-
го средства. Согласно К. Спенсу, пытав-
шемуся переносить на человеческое пове-
дение теорию научения Халла, MAS изме-
ряет общий уровень драйва — неспециа-
лизированного побуждения, которое как
раз достигает максимума при сочетании
нейротизма (специфическая активация,
по Айзенку) и интроверсии (неспецифи-
ческая активация) (Практикум по психо-
диагностике, 1984). Таким образом, на-
звания тестов не всегда однозначно вы-
ражают понятия об измеряемом свойст-
ве. В данном примере особенно подчерки-
вается роль психологической теории, ле-
жащей в основе методики для раскрытия
содержания показателей, получаемых с
ее помощью.


Дата добавления: 2018-10-25; просмотров: 275; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!