Порядок проведения эксперимента 7 страница



 

После этого формулируется ряд гипотез о том, каким образом данные разрабатываемого теста будут коррелировать с широким кругом других тестов, направленных как на близкие конструкты, так и на отдаленные. Гипотезы проверяются методами корреляционного и факторного анализа. Подтверждение или опровержение совокупности теоретически ожидаемых связей становится характеристикой конструктной валидности теста.

3. Критериальная валидность показывает, как результаты тестирования соотносятся с теми оценками измеряемого качества или свойства, которые получены другими (нетестовыми) способами, а именно: с мнениями специалистов, данными наблюдений и экспериментов, анализом продуктов деятельности испытуемых и т. д. Она может быть двух типов:

- валидностью текущей, когда результаты теста сопоставляются с данными из других источников, собираемых одновременно с тестированием;

- валидностью прогностической (предсказывающей), когда результаты теста сопоставляются с более поздним поведением испытуемого в данной сфере. К примеру, итоги тестирования учебных достижений в выпускном классе могут быть подтверждены, а могут быть и опровергнуты фактами о поступлении членов выборки в высшие учебные заведения.

Иногда применительно к некоторым из описанных типов валидности употребляют обозначение «эмпирическая валидность». Так называют те из них, при определении степени выраженности которых использовались статистические способы анализа данных, то есть коэффициенты вычислялись путем корреляций.

Каким образом соотносятся между собой характеристики эмпирической валидности и надежности?

Если высокая надежность теста свидетельствует, что он точно измеряет нечто, то высокая валидность указывает, что тест измеряет именно то, для чего он был разработан. Поэтому коэффициенты валидности не могут превышать значений коэффициентов надежности.

Обе рассмотренные характеристики непременно определяются составителями в ходе подготовки теста. Психолог, использующий тест в своей работе, благодаря этому получает представление о качестве измерения. Следует сказать и о том, что повторную проверку на надежность и валидность обычно проходят тесты, заимствованные, переведенные на другой язык. Без этого невозможно судить о качестве их социокультурной адаптации к новым условиям использования.

Бывает так, что тест обладает адекватной  валидностью и надежностью, но тем не менее, почти не находит применения в исследовательской практике. Это может быть обусловлено излишней сложностью процедуры интерпретации, чрезмерно высокими требованиями к квалификации тестирующего, значительной трудоемкостью и длительностью применения и т. д. Необходимо считать существенной еще одну характеристику психологического измерения - его экономичность.

Под экономичностью понимают целесообразность применения теста, определяемую наличием допустимого соотношения затрат на тестирование (времени, труда, финансов) и пользы от него.

Сказанное, разумеется, не означает, что тестирование непременно должно быть легким, коротким и «дешевым», пусть даже в ущерб другим качествам измерения. Речь идет именно о допустимом соотношении надежности, валидности и экономичности.

Перейдем к изучению основных видов тестов. Для этого воспользуемся одной из наиболее распространенных классификаций. В зависимости от особенностей интерпретации выполнения тесты подразделяются на два вида:

- ориентированные на статистическую норму;

- критериально-ориентированные (КОРТ).

Первые из них предполагают использование традиционного приема математической статистики - «нормирования» результатов. Что это такое?

Процедура разработки такого теста обязательно предусматривает установление норм его выполнения путем предварительного тестирования репрезентативной выборки лиц, для которых он предназначен. При этом выявляется диапазон тестовых баллов, характерный для низкого уровня развития данного психического свойства или функции, среднего уровня и высокого. В дальнейшем результаты испытуемого сравнивают с данными, полученными при тестировании выборки, определяя тем самым относительное его место в общем ряду.

Следует заметить, что задания ориентированного на статистическую норму теста подбираются таким образом, чтобы итоги их выполнения выборкой приближались к кривой нормального распределения Гаусса. Она имеет такой вид:

 

  -3s         -2s         -1s                         1s          2s          3s

Описание подобного распределения результатов может быть сделано с помощью двух показателей: среднего арифметического  и стандартного отклонения (s). Оба они получается путем несложных расчетов:

;                         ;

Где n - число членов выборки, - сумма полученных ими результатов,  - сумма значений всех индивидуальных отклонений от среднего арифметического.

Нормальным считается такое распределение результатов, при котором в пределах одного стандартного отклонения  находится 68 % испытуемых (то есть 34 % меньше среднего, 34 % больше среднего). Тогда в пределах двух стандартных отклонений останется 94,45 % испытуемых, а в пределах трех стандартных отклонений - почти все из них   (99,73 %). Зачем это все необходимо?

Тем самым и достигается возможность классифицировать испытуемых по отношению ко всей популяции, то есть судить о том, что они входят в группу людей с показателями выше или ниже нормы.

Для удобства работы осуществляют преобразование «сырых» баллов в стандартные единицы (стандартизацию). Сохраняя относительные позиции испытуемых, изменяют среднее арифметическое и стандартное отклонение путем добавления некоей константы к каждой отдельной величине. В психологии широко используется несколько таких шкал стандартных норм. Например, шкала Т-величин имеет среднее арифметическое 50 и стандартное отклонение 10, а, скажем, шкала коэффициента интеллекта имеет среднее равным 100, со стандартным отклонением 15 и т.д.

Интерпретируются эти показатели следующим образом: все результаты, которые не выходят за границы , находятся в пределах нормы. Те же лица, кто по тесту интеллекта получил значение IQ менее 85, находятся ниже нормы, а те, чьи результаты более 115 - выше нормы, далее, результаты от 115 до 130 интерпретируются как «несколько выше нормы», а от 130 до 145 - «значительно выше нормы». Соответственно классифицируются и результаты, располагающиеся ниже нормы.

Критериально-ориентированные тесты не предполагают подобного сопоставления данных испытуемых с итогами предварительного тестирования выборки. За точку отсчета в них принято не нормальное распределение, а определенный объем требований общества к психическому и личностному развитие его членов. Этот весьма обобщенный по своей природе феномен выражается в разрабатываемой составителями совокупности конкретных критериев.

В формулировке каждого такого критерия выделяется две части:

- содержательно-операциональная, четко характеризующая особенности действий испытуемых при выполнении тестовых заданий (типа «объясняет», «вычисляет», «подразделяет», «выбирает» и т. д.);

- соотносительно-предметная, детально описывающая тот или иной фрагмент области содержания знания на материале которого составлены тестовые задания. Обычно эта часть получает конкретизацию в ходе анализа составителями учебных программ, образовательных стандартов, действующих учебно-методических пособий и указаний.

Другими словами, одна часть критерия определяет, как надо сделать работу (каким образом), а другая - что надо сделать из предназначенного для усвоения (какой материал).

Разумеется, не каждая область знания поддается последовательной формализации для выражения в виде совокупности критериев. КОРТы, как правило, разрабатываются для диагностики сформированности умственных действий, а также для контроля за состоянием знаний, умений и навыков обучаемых. В этих случаях их применение позволяет, по словам А. Анастази,  осуществлять интерпретацию с упором на то «что индивид может делать и что он делает, а не на то, как он выглядит на фоне других» [2, с. 93].

Заметно большее распространение в настоящее время имеют тесты, интерпретация выполнения которых ориентирована на статистическую норму.                            

В зависимости от предмета измерения выделяют тесты:              

 интеллекта, обеспечивающие изучение уровня развития мышления и познавательных процессов в целом;

 способностей, оценивающие обучаемость, возможность и легкость овладения определенными знаниями, умениями и навыками. Сюда относят тесты общих и специальных способностей;

 достижений, определяющие обученность, то есть уровень овладения знаниями, умениями и навыками в какой-либо области (учебной, профессиональной, спортивной);

 личности, направленные на изучению различных аспектов личностного развития, таких как интересы, мотивы, эмоции, отношения и др.;

 межличностные, предусматривающие оценку человеческих отношений в группе, выявление специфики коммуникативных процессов.

По характеру тестовых заданий различают следующие виды тестов:

 вербальные, материал которых представлен в словесной форме;

 образные, где работа испытуемых производится с рисунками, схемами на основе возникающих при этом наглядных представлений;

 практические, выполняемые при манипулировании реальными объектами или их заместителями;

 комбинированные, объединяющие в себе как вербальный, так и невербальный материал заданий.

По форме предъявления заданий тесты подразделяются на бланковые («бумаги и карандаша»), аппаратурные, рисуночные и устные.

В зависимости от количества испытуемых тесты делятся на индивидуальные и групповые.      

По времени выполнения тесты бывают двух видов:

 скорости, в которых основным показателем работы испытуемых является темп решения заданий. Оценивается либо общее количество правильно выполненных заданий за отведенное время, либо объем времени, затраченного на выполнение теста;

 результативности, где показатель скорости работы испытуемых не имеет соотнесения с результатами тестирования, не влияет на них. Временное ограничение (если оно есть) не является жестким, оно служит лишь целям обеспечения стандартизации процедуры измерения.

Следует заметить, что в психодиагностической практике наряду с тестами находят активное применение личностные опросники. Это методики, задания которых представлены в виде вопросов или утверждений. Задача испытуемого - дать письменные или устные ответы, сообщить информацию о себе, выразить отношение, сформулировать мнения.

По своей сути, опросники предполагают осуществление испытуемым субъективного самоотчета. От анкет, которые будут детально рассмотрены нами в дальнейшем, личностные опросники отличаются следующим:

1) направленностью на изучение психологических особенностей;

2) стандартизацией процедур применения и интерпретации;

3) опорой на содержание определенной научной концепции, теории;

4) наличием норм выполнения или соответствующих критериев развития, по отношению к которым осуществляется стандартизация индивидуальных результатов.

5) проверкой степени валидности и надежности.

Все это, а также нередко более искусная постановка вопросов, маскирующая их диагностическую специфику, и тщательная разработка контроля за достоверностью и искренностью ответов («шкалы лжи»), позволяют считать их «тестами-опросниками»       [10, с. 53], а не методиками самонаблюдения или традиционного опроса.

Примерами таких тестов-опросников являются Миннесотский многоаспектной личностный перечень (ММРI), разработанный С. Хатуэем и Дж. Маккинли в 1940 году и до сих пор широко использующийся в клинической психодиагностике, Патохарактерологический диагностический опросник (ПДО), предложенный А. Е. Личко (1970) для определения психопатического развития личности и акцентуаций характера, методика многофакторного исследования личности Р. Кеттелла (16-ти факторный опросник) и т. д.

В заключение, необходимо отметить следующее: использование метода тестов для исследований требует наличия как общепсихологических знаний, так и компетентности в области теории и практики измерения. Дело в том, что изучение сложных психических феноменов не сводится к чисто «технической» деятельности по предъявлению заданий и регистрации решений. Недостаток квалификации нередко оборачивается потерей индивидуального подхода, грубейшими дефектами интерпретации результатов, увеличением числа ошибок при организации процедуры испытания.

 

ОСНОВНЫЕ ПОНЯТИЯ: тестирование; тест; стандартизированность; коэффициент интеллекта; надёжность; типы надёжности: ретестовая, параллельных форм, частей теста; валидность; типы валидности: содержательная, конструктная, критериальная, текущая, прогностическая, эмпирическая; экономичность; ориентированные на статистическую норму тесты; критериально-ориентированные тесты; тесты: интеллекта, способностей, достижений, личности, межличностные, вербальные, образные, практические, комбинированные, бланковые, скорости, результативности; личностные опросники.

 

Вопросы для обсуждения:

 

1. Чем отличается тестирование от эксперимента? Каковы его основные особенности?

2. Какие характеристики качества измерения Вам известны? О чем информируют исследователя значения коэффициентов каждой из них?

3. Какие существуют разновидности тестов?

 

ЛАБОРАТОРНАЯ РАБОТА № 1

ЦЕЛЬ: выработка умений составления заданий для тестирования учебных достижений школьников.

 

Структурно тестовое задание обычно состоит из четырех частей:

1. Инструкция;

2. Текст задания (вопроса);

3. Варианты ответов (кроме тех случаев, когда ответ надо сформулировать самостоятельно);

4. Правильный ответ.

При этом под инструкцией понимается совокупность понятных и кратких указаний на то, что именно должен сделать испытуемый и каким образом ему следует зафиксировать результат своих действий. Как правило, инструкции предваряют серию однотипных заданий. Они могут иметь такой вид:

 

«Подчеркните тот вариант ответа из перечисленных, который вы считаете правильным».

«Впишите пропущенные слова на месте многоточий».

«В левом ряду - имена государственных деятелей предвоенного периода, в правом - занимаемые ими в то время должности. Соедините их стрелками, установив взаимосвязи имен и должностей. При этом некоторые имена останутся лишними».

«Что вы думаете по поводу приведенных ниже мнений? Сформулируйте письменно свою позицию, представив обоснования ее правильности. Время работы - 15 минут. Работайте...»  

 

Текст задания должен содержать одну законченную мысль или однозначно понимаемое утверждение. В нем не должно быть лишних слов, непреднамеренных подсказок, скрытых подвохов. Желательно избегать в вопросе выражений отрицания.

В чем состоят недостатки данных заданий?

 

«Как известно, в 1709 году русская армия разгромила шведские войска Карла ХII под стенами одного украинского города. Как называется одноименная поэма А. С. Пушкина?»

«Вы знаете о том, что в 1703 году Петром I был заложен город Санкт-Петербург. Одобряли или не одобряли бояре, жившие в то время, это событие?»

«Как звали сподвижника Петра Великого, внесшего заметный вклад в качестве командующего армией в победу России в Северной войне?»  

«Чем завершился Прутский поход русской армии в 1910 году?»  

 

В том случае, если задание содержит варианты ответов, к ним предъявляются следующие требования:

- неправильные ответы должны быть внешне похожи на правильные;

- все варианты необходимо грамматически согласовать с вопросом;

- выбор ответа не должен зависеть от содержания предшествовавших вопросов и ответов;

- местоположение правильного ответа определяется в случайном порядке;

- неверные ответы не должны содержать очевидных несообразностей и явных неточностей;

- лучше использовать длинный вопрос и короткие ответы, чем наоборот;

- если ответов несколько, то необходимо их логически упорядочить (например, от меньшего к большему выражению некоего качества).

Эталонный ответ формулируется предельно однозначно для того, чтобы исключить возможности проявлений субъективизма  лица, оценивающего результаты тестирования. При этом указываются все синонимичные варианты правильного ответа.

Рассмотрим теперь классификацию видов заданий в тестах учебных достижений.

ЗАДАНИЯ СО СВОБОДНОЙ ФОРМОЙ ОТВЕТОВ (предусматривают самостоятельное составление испытуемыми своих ответов):

1. Краткие ответы на вопросы.

Например:

 

«Как называется группа, поведение членов которой становится для человека образцом для подражания?»

«С помощью какого понятия можно выразить стремление члена группы «быть как все?»

«При каком стиле управления группой все решения принимает единолично ее руководитель?»

 

2. Дополнения текстов, рисунков, рядов чисел.

 

«Социальная фасилитация - это... качества работы человека из-за присутствия...»

«Стремление людей во что бы то ни стало поступать... воле... называют нонконформизмом».

«По степени добровольности участия малые группы подразделяются на... и... .»

 

3. Микросочинения, рассуждения на заданную тему,

 

«Среди множества ироничных определений психологии есть и такое: «Это наука о студентах-второкурсниках и белых крысах»... Почему оно возникло?  Насколько сохранило актуальность в настоящее время? Обоснуйте свое мнение».

«Подготовьте развернутый ответ на вопрос: каковы причины появления «знаменитого» постановления ЦК ВКП(б) «О педологических извращениях в системе Наркомпросса» (1934г)?»

 

ЗАДАНИЯ С ЗАКРЫТОЙ ФОРМОЙ ОТВЕТОВ (предполагают выбор испытуемым правильных ответов из представленного множества):

4. Альтернативные ответы, содержащие только два варианта. Например:

 

«Конформизм проявляется, когда человек изменяет свою позицию в соответствии с мнением большинства группы

а) верно; б) неверно».

«Роберт Зайонц доказал, что возбуждение индивида от присутствия других его доминирующую реакцию


Дата добавления: 2019-02-13; просмотров: 324; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!