Отношение истинного показателя к генеральной совокупности заданий



 

В данной модели истинный показатель - это показатель, который бы получил индивидуум, если бы ему были предъявлены все возможные задания. Следовательно, погрешность тестов отражает степень, в которой реальная выборка заданий охватывает их генеральную совокупность. Следует отметить, что в этой модели, таким образом, не учитываются другие источники погрешности измерений, такие, например, как самочувствие испытуемого, температура воздуха в помещении и адекватность лица, проводящего обследование.

 

Статистические основания классической модели

 

Статистические основы классической модели полностью описаны у Nunnally (1978). Здесь же будут представлены основные положения. Как уже было оговорено, истинный показатель - это показатель испытуемого в гипотетической генеральной совокупности заданий.

Эта генеральная совокупность заданий порождает корреляционную матрицу (бесконечно большую) попарных корреляций между заданиями. Среднее значение корреляции между заданиями для этой матрицы, nj , указывает степень общих пересечений между заданиями. Так, если, например, мы вставили в тест одно задание из всего множества несвязанных между собой заданий, то среднее значение корреляции между заданиями должно быть равно 0,00 , указывая, довольно правильно, что между заданиями не было ни одного пересечения. Аналогично, разброс корреляций вокруг указывает меру различия заданий по степени их вхождения в общие пересечения. В данной модели предполагается, что все задания имеют одинаковое значение вхождения в общее пересечение, что означает, что средняя корреляция каждого задания с другими одна и та же для всех заданий.

Это и есть базовое предположение данной модели. Исходя из классической модели, можно показать, что корреляция некоторого задания с истинным показателем равна квадратному корню от его средней корреляции с другими заданиями. У Nunnally (1978) приведен полностью вывод следующей формулы:

 

гн=У7ц (1.2)

 

Строго говоря, это верно только тогда, когда количество заданий приближается к бесконечности, но если даже используются только 100 заданий, изменение коэффициентов корреляции будет небольшим.

С точки зрения конструктора тестов, формула (1.2) имеет большое значение, поскольку если он разработает большое количество заданий и выберет из них те, для которых значение квадратного корня из средних корреляций с другими заданиями является большим, тогда по определению его тест будет иметь более высокую корреляцию с истинным показателем; то есть будет в высокой степени надежным и свободным от погрешностей измерения. Ясно, что формула (1.2) является статистическим основанием для выбора заданий изо всей их совокупности. Это не применимо к тестам скорости (speeded tests), в которых корреляция невыполненных заданий задается искусственно.

Аналогичные рассуждения, касающиеся взаимосвязи заданий, применимы в точности к параллельным тестам для измерения одной и той же переменной, когда каждый тест рассматривается как случайная выборка заданий из генеральной совокупности заданий. Средние значения и дисперсии таких случайных выборок отличаются от истинного показателя только случайным образом. Следовательно, если во всех рассмотренных нами уравнениях стандартные показатели для заданий будут заменены стандартными показателями для тестов (т.е. наборов заданий), может быть опять использован процесс редукции, и, таким образом, формула (1.2) может быть записана в виде га = п1, где гц - корреляция показателей по тесту 1 и истинного показателя, и гц -средняя корреляция теста 1 со всеми тестами из генеральной совокупности.

 

Коэффициент надежности (reliability coefficient)

 

Средняя величина корреляции одного теста или задания со всеми тестами или заданиями из генеральной совокупности называется коэффициентом надежности. Квадратный корень из коэффициента надежности является корреляцией данного теста или задания с истинным показателем (как указывает формула (1.2)). Однако, на практике невозможно точно вычислить это теоретическое значение надежности Гц, потому что количество разработанных нами заданий и тестов не является бесконечным. Это означает, что надежность (Гц) некоторого теста можно оценить лишь приблизительно.

Таким образом, на практике коэффициенты надежности основаны на корреляции одного теста с другими, и эта оценка может быть не очень точной. Это, означает, что имеющая более существенное значение корреляция теста или задания с истинным показателем также может быть оценена неточно.

 

Выборочные показатели

 

Это показатели любого теста, то есть показатели, состоящие из истинных показателей и погрешностей измерения. Любой коэффициент надежности, который мы получаем на практике, гц, для некоторого теста или задания, будет аппроксимировать Гц. Если предположить, что гц = г-ii, то r-it (корреляция истинного и выборочного показателей) = Гц. Таким образом, может быть получена оценка для гц. Исходя из этого, можно получить оценки истинных стандартных показателей из выборочных показателей по следующей формуле:

 

Zt = ru zi = VT-II 21 (1.3)

 

где zf - оценки истинных стандартных показателей, z, - стандартные показатели для выборочного измерения, гц - корреляция выборочных показателей и истинных показателей, и г-н - это надежность переменной.

 

Так как квадрат коэффициента корреляции равен дисперсии одной переменной, выраженной в терминах другой, гц - относительная доля дисперсии истинных показателей, выраженная величиной выборочного измерения, а гц = /;; , следовательно, квадрат надежности равен относительной доле дисперсии истинных показателей, выраженной через значения выборочных измерений.

Действительно, как показано у Nunnally (1978), если показатели

теста являются смещенными или ненормализованными («сырыми»)

показателями (в отличие от стандартных показателей), то:

 

_о?

 

/»II - -у

 

of

 

2 35

 

(1.4)

 

тле of- дисперсия переменной I ,nfff- дисперсия переменной

1, выраженная в истинных показателях, а гц - надежность.

 

Это удобная формула для оценивания О?, так как //; и fff легко

вычисляются. Очевидно, что исходя из классической модели погреш-

ностей, надежность - это чрезвычайно важный параметр.

 


Дата добавления: 2018-02-18; просмотров: 620; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!