Надежность как критерий оценки качества теста. Приемы обеспечения точности (учет ошибки измерений) и устойчивости (стандартизации процедуры тестирования).



Выделяют три типа надежности (К. М. Гуревич):
1. надежность самого измерительного инструмента.
2. стабильность изучаемого признака.
3. константность, (независимость результатов от личности экспериментатора).
Надежность теста показывает независимость его результатов от действия разных случайных факторов. Средняя относительная величина этого отклонения определяется как "стандартная ошибка измерения" (Se). Величина ошибки измерения указывает на уровень неточности или ненадёжности тестовой шкалы.
Надёжность – характеристика методики, отражающая точность психодиагностических измерений, а также устойчивость результатов теста к действию посторонних случайных факторов. Надёжность теста проявляется в согласованности оценок у испытуемых при их повторном тестировании тем же самым тестом или его эквивалентной формой. Прежде чем приступать к широкому использованию психологического теста, необходимо провести тщательную объективную проверку его надёжности. Результаты тестирования зависят от множества факторов: качества измерительного инструмента, правильности понимания инструкции испытуемым, поведения экспериментатора, психологического состояния испытуемого. Изменение любого из этих факторов в ходе проведения эксперимента обычно приводит к снижению степени надёжности измерений. В основе надёжности теста лежит представление об истинных оценках и ошибках измерения. Для выявления ошибки измерения используют метод ретестирования – повторное обследование одной и той же выборки испытуемых. Однако, несмотря на простоту и возможность определения устойчивости результатов теста в течение времени, недостаток метода состоит в том, что субъект помнит свои ответы, и в случае тестов способностей это может существенно влиять на повторные ответы. Если нужно исключить влияние запоминания на результаты ответов как систематический источник ошибки и учесть влияние временного интервала на ответы, то можно использовать две совокупности заданий, разработанных или отобранных по одной схеме – параллельные тесты. Однако на практике сложно создать параллельные формы одного и того же теста. Факторов, влияющих на надёжность тестирования, достаточно много и обеспечивать постоянство их всех практически невозможно, но они гораздо меньше влияют на достоверность получаемых результатов, главным же является надёжность самой методики.

 

15.Виды надежности. Последовательность действий при проверке надёжности. Надёж-ть-один из критериев качества теста, его устойчивость по отношению к погрешностям измерения. Различают 2 вида надёжности — надёж-ть как устойчивость и надёжность как внутреннюю согласованность.

Надёж-ть как устойчивость. Устойчивость результатов теста или ретестовая– возможность получения одинаковых результатов у испытуемых в различных случаях.Устойчивость определяется с помощью повторного тестирования:В данном методе предлагается провести несколько замеров с некоторым промежутком времени (от недели до года) одним и тем же тестом. Если корреляция между результатами различных замеров будет высокой, следовательно, тест достаточно надежный. Наименьшее удовлетворительное значение - 0,5.Однако надежность не всех тестов можно проверять этим методом, т.к. оцениваемое качество, явление или эффект м\б сами по себе нестабильны (нап-р, наше настроение, кот. может меняться от одного замера к следующему). Еще один недостаток повторного тестир-я – это эффект привыкания. Испытуемые уже знакомы с этим тестом, а м\б, даже помнят большую часть своих ответов. Поэтому применяется исследование надежности методик с использ-ем параллельных форм, при кот-х конструируются эквивалентные или параллельные наборы заданий. И испытуемые выполняют совершенно другой тест при аналогичных условиях.

Надёж-ть как внутренняя согласованность.Внутренняя согласованность определяется связью каждого конкретного элемента теста с общим результатом, тем, насколько каждый элемент входит в противоречие с остальными, насколько каждый отдельный вопрос измеряет признак, на который направлен весь тест. тесты разрабатываются таким образом, чтобы у них была высокая степень внутренней согласованности, а если одна переменная измеряется частью теста, то тогда в других частях, если они не согласованы с первой, эта же переменная измеряться не может. Чтобы тест был валидным надо, чтобы он был согласован. Для проверки внутренней согласованности применяются: метод расщепления или метод автономных частей, метод эквивалентных бланков Альфа Кронбаха.

В.В.Столин,предлагает следующие действия для проверки надежности теста:

1.Узнать, существуют ли данные о надежности теста, предполагаемого к использованию, на какой популяции и в какой диагн-ой ситуации проводилась проверка.Если проверки не было или признаки новой популяции и ситуации специфичны, провести заново проверку надежности с учетом возможностей.

2.Если возможности обследования испытуемых, смысл теста и возможности обработки позволяют, то произвести 2ое тестирование на всей выборке стандартизации и подсчитать все коэффициенты, приведенные в настоящем параграфе, как для целого теста, так и для отдельных пунктов.

3. Если возможности ограничены, произвести повторное тестирование только на части выборки (не менее 30 испытуемых), подсчитать (вручную) ранговую или 4-ёхклеточную корреляцию для оценки внутренней согласованности (методом расщепления) и стабильности целого теста.

 

 

16.Надежность-устойчивость (ретестовая надёжность).

Устойчивость результатов теста или ретестовая надежность (англ - test-retest reliability) – возможность получения одинаковых результатов у испытуемых в различных случаях.

Устойчивость определяется с помощью повторного тестирования (ретеста):

В данном методе предлагается провести несколько замеров с некоторым промежутком времени (от недели до года) одним и тем же тестом. Если корреляция между результатами различных замеров будет высокой, следовательно, тест достаточно надежный. Наименьшим удовлетворительным значением для ретестовой надежности является 0,5. Однако надежность не всех тестов можно проверять этим методом, так как оцениваемое качество, явление или эффект могут быть сами по себе нестабильны (например, наше настроение, которое может меняться от одного замера к следующему). Еще один недостаток повторного тестирования – это эффект привыкания. Испытуемые уже знакомы с этим тестом, а может быть, даже помнят большую часть своих ответов после предыдущего заполнения.

В связи с выше сказанным применяется исследование надежности психодиагностических методик с использованием параллельных форм, при которых конструируются эквивалентные или параллельные наборы заданий. При этом испытуемые выполняют совершенно другой тест при аналогичных условиях. Однако имеются трудности в доказательстве того, что обе формы являются действительно эквивалентными. Несмотря на это, на практике параллельные формы тестов оказываются полезными в установлении надежности тестов.

 

 


Дата добавления: 2016-01-05; просмотров: 38; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!