Лабораторные работы



по курсу “Искусственный интеллект”

 

СОГЛАСОВАНИЕ ПО ИНФОРМАТИВНОСТИ ШКАЛ РАЗЛИЧНЫХ ТИПОВ: АБСОЛЮТНОЙ ШКАЛЫ, ШКАЛЫ ПОРЯДКА И ШКАЛЫ НАИМЕНОВАНИЙ

 

Когнитивный анализ исходных данных, которые обычно отображаются многомерными таблицами типа «объект-свойство-время», включает в себя решение двух связанных между собой задач анализа и синтеза, реализуемых с помощью математических или логических операций над значениями свойств (признаков) объектов. Выявленные в результате анализа закономерности связей между элементами таблицы используются для предсказания значений одних элементов по известным значениям других элементов. Выбор вида выполняемых операций зависит от типа шкалы, в которой оценивался тот или иной признак.

Абсолютная шкала относится к типу шкал, которые называют сильными, количественными или арифметическими, показания таких шкал содержат более богатую информацию и их можно подвергнуть определённым математическим преобразованиям. Абсолютная шкала удобна тем, что если на одном языке в протоколе записано y, а на другом языке записано x, то данное преобразование представляет собой тождество . Этот тип шкал удобен также для записи количества элементов в некотором множестве, например, в виде тождественного отношения 6 = VI.

Шкала порядка отражает качественные свойства объектов или явлений, но при этом уступает по информативности, поэтому такой тип обычно называют слабым или качественным. Это не означает, однако, что по сравнению с сильными, данной шкалой пользуются намного реже. Для шкалы порядка допустимыми являются все монотонные преобразования, которые не нарушают порядок следования значений измеряемых величин. Например, записи результатов сравнения тел по твёрдости (1, 3, 5) и (7, 13, 101) содержат идентичную информацию о том, что первое тело самое твёрдое, второе менее твёрдое, третье – самое мягкое. В этих записях не содержится информации о том, во сколько раз или на сколько единиц одно тело твёрже другого. Разновидностью шкалы порядка является шкала рангов, в которой используются только числа, идущие подряд от единицы до m по возрастанию. При этом если значения измеряемого свойства k объектов, занимающих порядковые места с t -го по , одинаковые, то их ранги в «нормированной» шкале обозначаются одинаковым числом, равным их среднему рангу x:

. (1)

Таким образом, порядковый ряд 1(x 1=1), 5(x 2=2), 5(x 3=3), 10(x 4=4) в «нормированной» шкале рангов будет выглядеть: 1; 2,5; 2,5; 4.

Ещё одной разновидностью шкалы порядка является шкала баллов, в которой задействованы целые числа в ограниченном диапазоне значений, например: от 1 до 5 (или 10) в системе образования; от 1 до 6 (или 10) в спорте, на музыкальных конкурсах, играх и т. д. Необходимо отметить специфическую особенность шкал порядка, которая состоит в том, что порядковые номера здесь нельзя принимать в качестве абсолютных величин и выполнять над ними какие-либо математические операции. Протокол должен содержать информацию только о трёх эмпирических отношениях: “<”, “>” и “=”. Например, нельзя говорить, что студент, который получил четвёртку, знает предмет в два раза лучше студента, который получил двойку.

В шкале наименований регистрируются только два отношения: “=”, “≠”, т. е. в протоколе одинаковые объекты при любых допустимых преобразованиях должны обозначаться одинаковыми символами (числами, буквами, словами), а разные должны иметь разные имена.

Для сравнения информативности шкал различного типа обычно определяют количество возможных неизоморфных протоколов, которые можно получить на языке этих шкал при заданных значениях m и n, где m – число возможных состояний прибора, который измеряет некоторое свойство у n – объектов. Например, протоколы <3,12> и <4,16> в абсолютной шкале будут неизоморфными, а в шкалах отношений, порядка и наименований – одинаковыми (изоморфными). Если , то не зависимо от типа шкалы количество неизоморфных протоколов равно m.

По данной методике проведено сравнение количества неизоморфных протоколов sП, sН и sА для шкал трёх типов, соответственно: порядковой, наименований и абсолютной. Установлено, что при фиксированном числе градаций m с ростом количества исследуемых объектов n отличие по информативности различных шкал уменьшается. Отношение sН / sА при этом изменяется незначительно и остаётся малым, тогда как отношение sП / sА растёт быстро и при n >5 m достигает величины 0,9. Таким образом, в экспериментах с большим числом объектов информативность шкалы порядка приближается к информативности абсолютной шкалы.

В связи с тем, что в реальных задачах шкалы отношений и интервалов используются достаточно редко, далее материал излагается только применительно к трём из описанных типов шкал: абсолютной, порядковой и наименований.

Рассмотрим характерный для реальных задач случай, когда свойства изучаемых объектов измеряются с использованием различных, в том числе порядковых и номинальных шкал. Остановимся на непростой проблеме оценки меры расстояния как между объектами (строками информационной матрицы), так и между свойствами (столбцами этой матрицы) при обработке разнотипных шкал. Прежде рассмотрим представление данных без искажения их содержания в шкалах порядка и наименований.

В шкале порядка при всех допустимых преобразованиях для этой шкалы fП отношения из набора <, >, = между двумя числами xi и xl должны сохраняться и для чисел fП (xi) и fП (xl). В матрице размером m × m (m – число объектов в выборке А) в i- й строке указывается в каких порядковых отношениях находится i -й объект ко всем остальным объектам выборки А или какую порядковую роль играет он в соответствующей матрице ролей. Два объекта считаются одинаковыми, если они имеют одинаковые порядковые отношения со всеми другими объектами. При анализе содержания элементов на пересечении k -го столбца с i -й и l -й строками суммарное и усреднённое различие в отношениях i -го и l- го объектов оценивается в соответствии с выражениями:

, (2)

где d (i, l) k = 0, если (xik ="<" и x l k = "<"), или (xik =">" и x l k =">"),

или (xik ="=" и x l k ="=");

d (i, l) k = 1, если (xik ="<" и x l k = ">"), или (xik =">" и x l k ="<");

d (i, l) k = 0,5, если (xik ="=" и x l k ="<,>"), или (xik ="<,>" и x l k ="=").

В таблице 1 приведены данные, имеющие в шкале порядка следующие значения: x= 11; 6; 9; 11; 4; 109. Те же данные в нормированных рангах (в скобках) соответственно равны: x'= 4,5; 2; 3; 4,5; 1; 6. В обеих шкалах расстояние между 2-й и 3-й строкой равно 1, а между 5-й и 6-й – 5.

Таблица 1


Дата добавления: 2015-12-21; просмотров: 15; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!