Выборка должна удовлетворять следующим требованиям:



а) полноты - в составе генеральной совокупности должны находиться все ее элементы, иначе выборка будет смещена;

б) точности - информация по каждой единице наблюдения должна быть реальной. Если, например, основой выборки служат списки учащихся, то они должны быть уточнены, чтобы в них не попали выбывшие учащиеся;

в) отсутствия дублирования - каждая единица наблюдения не должна повторяться, т.е. попадать в список дважды;

г) адекватности - основа выборки должна соответствовать целям и за­дачам обследования. По существу проблема адекватности основы выбор­ки - это проблема правильного определения (конструирования) генераль­ной совокупности;

д) удобства работы - единицы наблюдения, входящие в генеральную совокупность, необходимо пронумеровать, а фамилии и инициалы четко вписать в общий список.

Объем выборки зависит от числа признаков, относительно которых она производится, и должен быть велик настолько, чтобы в каждую выделен­ную группировку попало достаточное количество элементов.

 

Вопрос 2. Надежность теста и проблема угадывания правильного ответа. Разные способы оценки надежности. Ретестовая надежность.

 

Достаточно надежный тест позволяет получить устойчивую оценку спо­собностей испытуемых той группы, к которой он применяется.

Надежность теста как средства измерений определяется отсутствием ошибок измерения тестовых баллов и тем, в какой мере результаты изме­рений воспроизводятся при многократном использовании теста по отноше­нию к данной группе испытуемых. Ошибки измерения возникают в связи с усталостью испытуемого, нервным напряжением, содержанием включенных в тест заданий, ошибочными ответами, неправильной интерпретацией инструкций и попытками угадать ответ. Эти ошибки снижают индивидуаль­ные результаты испытуемого и надежность теста.

А. Анастази выделяет случайные ошибки, вызванные невнимательнос­тью или незнанием учащегося, и истинные ошибки, то есть ошибки, допу­щенные в конструкции теста. С этой точки зрения надежность показывает, в какой степени индивидуальные различия вызваны истинными, а какие случайными ошибками.

Чтобы оценить вклад различных источников в ошибку измерения, необ­ходимо использовать разные способы оценки надежности. Прежде всего это ретестовая надежность. Для этого тест используют второй раз, и коэффи­циент надежности в этом случае равен корреляции между результатами, по­лученными на одних итех же испытуемых в каждом из случаев проведения теста. Чем выше ретестовая надежность, тем менее чувствительны результаты к обычным изменениям состояния испытуемого и обстановке тестирования.

Ретестовая надежность зависит от интервала времени, в котором она происходит. С увеличением времени данный вид надежности уменьшает­ся. С другой стороны, если промежуток времени невелик, то испытуемые припоминают свои прежние ответы. В этом случае обследуемые указыва­ют примерно одинаковые правильные и неправильные ответы и коэффи­циент корреляции окажется обманчиво высоким.

Другой способ определения надежности - метод расщепления. В этом случае каждый испытуемый получает два результата при разбивке теста на две сопоставимые части. При такой методике надежность является ме­рой согласованности выборок содержания. Временная стабильность пока­зателей в ней не представлена, так как применяется только один сеанс тестирования. Благодаря этому метод расщепления иногда называют ко­эффициентом внутренней согласованности.

Еще одним способом определения надежности является надежность взаимозаменяющих форм. При этом те же самые испытуемые первый раз те­стируются с помощью одной формы теста, второй раз - с помощью другой, сравнимой формы. Корреляция между показателями, полученными по этим двум формам, и служит коэффициентом надежности теста. При этом изме­ряется как временная стабильность теста, так и согласованность ответов по двум выборкам заданий.

Один из доводов критиков тестирования заключается в том, что для боль­шинства заданий существует вероятность случайного угадывания правиль­ных ответов. В общем случае это проблема только заданий закрытого типа, и чем меньше возможных альтернатив предлагается испытуемому в рам­ках одного задания, тем больше вероятность угадывания. Однако для за­даний альтернативных ответов, используемых одиночно, вероятность уга­дывания максимальна и составляет 50%. Исследователи настоятель­но не рекомендуют использовать такие задания для тестов школьных достижений. Серия из пяти заданий альтернативных ответов дает вероят­ность угадывания 0,0313, а из десяти заданий - всего лишь 0,00098.

Проблема угадывания зависит и от времени, выделяемого на тестиро­вание, и в меньшей степени, от мотивации. Чем выше мотивация, тем боль­ше вероятность того, что испытуемый попытается дать ответ случайно на те вопросы, на которые он не успевает ответить, то есть попытается уга­дать. В свою очередь, количество вопросов, по которым возможно будет угадывание, зависит от времени, выделяемого на тестирование. Чем оно короче, тем больше будет вопросов, на которые распространится случай­ное угадывание. Таким образом, для времени, выделяемого на тестирова­ние, должен быть найден баланс: недостаток его ведет к угадыванию, из­быток - к подсказкам и ослаблению дисциплины.

 

Вопрос 3. Факторы, оказывающие влияние на надежность тестового инструментария.

 


Дата добавления: 2021-04-15; просмотров: 71; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!