Пример дискриминантного анализа: диагностика острого аппендицита



Данные заимствованы из книги «С. Г. Григорьев, А. М. Перфилов, В. В. Левандовский, В. И. Юнкеров — STATGRAPHICS на персональном компьютере. — Санкт‑Петербург, 1992».

Многие люди либо на собственном опыте, либо на случаях с родными и близкими воочию убедились как бывает важно и, вместе с тем, непросто установить точный диагноз острого аппендицита. Это достаточно тонкая проблема, нередко требующая привлечения знаний и умений врача самой высокой квалификации.

Таблица 6. 4. Симптомы острого аппендицита и их коды

  Симптомы острого аппендицита Выраженность Код
X1 Боли в правой подвздошной области незначительные 1
    выраженные 2
X2 Продолжительность болей свыше 2‑х суток 1
    25‑48 часов 2
    13‑24 часа 3
    до 12 часов 4
X3 Частота пульса до 80 уд/мин 1
    21‑100 уд/мин 2
    свыше 100 уд/мин 3
X4 Лейкоциты крови до 8 тыс. 1
    8‑14 тыс. 2
    свыше 14 тыс. 3
X5 Изменения языка не обложен 0
    обложен 1
X6 Симптом Щеткина‑Блюмберга отсутствует 0
    выражен 2
X7 Симптом Ровзинга отсутствует 0
    выражен 2
X8 Защитное мышечное напряжение отсутствует 0
    выражено 2

В качестве исходной информации использовались данные клиники, в которых зарегистрированы результаты обследования 103 человек с установленным диагнозом: группа 1 — гангренозный аппендицит (28 наблюдений), группа 2 — флегмонозный аппендицит (25 наблюдений), группа 3 — катаральный аппендицит (26 наблюдений) и группа 4 — неподтвержденный диагноз (24 наблюдения). Исходными признаками служили 8 симптомов, охарактеризованных в таблице.

Таблица 6. 5. Результаты клинического обследования

group x1 x2 x3 x4 x5 x6 x7 x8
1 2 3 1 2 1 2 2 2
1 2 2 2 2 1 2 0 2
1 2 3 1 3 1 2 2 2
1 2 2 3 1 1 0 2 2
1 2 3 2 2 1 2 2 0
1 2 3 1 3 0 0 2 2
1 2 2 2 2 1 2 0 2
1 2 4 1 3 1 2 2 2
1 1 2 2 3 1 2 2 2
1 2 3 2 2 1 2 2 2
1 2 1 1 3 1 2 2 0
1 2 3 2 2 1 2 2 2
1 2 2 1 3 0 2 0 2
1 2 3 2 2 1 0 2 2
1 2 4 2 2 1 2 2 2
1 2 2 1 3 1 2 2 2
1 2 3 3 2 1 2 0 2
1 1 1 2 2 0 2 2 2
1 2 3 2 3 1 2 2 2
1 2 1 1 3 1 0 2 2
1 2 3 3 2 1 2 2 2
1 2 3 2 3 1 2 2 0
1 2 2 1 2 1 2 0 2
1 2 3 2 2 0 2 2 2
1 2 3 1 2 1 2 2 2
1 2 3 2 3 1 2 2 2
1 2 3 1 3 1 2 2 2
1 2 3 1 2 1 2 2 2
2 2 3 1 2 1 2 2 0
2 1 4 2 1 0 2 0 2
2 2 3 1 3 1 0 2 2
2 1 4 2 2 1 2 2 2
2 2 4 1 2 0 2 2 2
2 2 4 2 2 1 2 0 0
2 1 2 1 2 1 2 2 2
2 2 4 2 3 0 0 2 2
2 1 3 1 1 1 2 0 2
2 2 4 1 2 1 2 2 0
2 2 4 1 3 0 2 2 2
2 1 2 1 2 1 0 0 2
2 2 3 1 3 1 2 2 0
2 1 4 1 1 1 2 2 2
2 2 4 1 2 0 2 0 2
2 2 3 1 2 1 0 2 0
2 1 4 2 2 1 2 2 2
2 2 4 1 3 0 2 2 2
2 2 3 1 2 1 2 0 0
2 1 4 2 1 1 0 2 2
2 2 3 1 2 0 2 2 2
2 2 4 1 2 1 2 2 2
2 2 4 2 2 1 2 2 2
2 2 4 2 3 1 0 2 2
2 1 3 2 2 1 2 2 2
3 1 3 1 2 1 0 2 2
3 2 4 1 1 0 2 0 0
3 2 3 1 2 1 0 2 2
3 2 4 2 2 1 2 0 0
3 1 2 1 1 0 0 2 2
3 2 3 1 3 1 2 2 0
3 2 4 1 2 1 2 2 2
3 2 1 1 1 1 2 2 0
3 1 4 1 2 0 0 0 2
3 2 1 2 2 1 2 2 0
3 2 3 1 1 1 2 0 2
3 2 4 1 2 1 0 0 0
3 1 3 1 1 0 2 2 0
3 2 4 1 2 1 0 2 2
3 2 3 2 2 1 2 2 2
3 1 4 1 1 0 0 2 0
3 2 3 1 2 1 2 2 0
3 2 4 2 2 1 2 0 2
3 2 3 1 3 0 0 2 2
3 2 4 1 2 1 0 0 0
3 1 3 1 1 1 2 2 0
3 2 3 1 2 0 2 2 2
3 2 4 1 2 1 2 2 2
3 1 4 2 1 1 2 2 0
3 2 3 1 2 1 2 2 0
3 1 4 1 2 1 2 2 0
4 1 2 1 1 0 0 0 0
4 1 1 2 1 0 0 0 0
4 1 3 1 1 1 0 0 0
4 2 1 1 2 0 0 0 0
4 1 2 1 1 0 0 0 0
4 1 1 1 1 0 0 0 0
4 1 2 1 1 0 0 0 0
4 1 1 2 1 1 0 0 0
4 1 2 1 2 0 0 0 0
4 2 1 1 1 0 0 0 0
4 1 2 1 2 1 0 0 0
4 1 2 1 2 1 0 0 0
4 1 1 1 2 0 0 0 0
4 1 1 2 1 0 0 2 0
4 1 4 1 1 0 0 0 0
4 1 3 1 1 0 0 0 0
4 2 1 1 2 1 0 0 0
4 1 4 1 1 0 0 0 0
4 1 2 1 1 0 0 0 0
4 1 1 1 2 1 0 0 0
4 1 2 1 1 0 0 0 0
4 1 1 2 1 0 0 0 0
4 2 1 1 1 0 0 2 0
4 1 2 1 1 0 0 0 0

Вводим представленные данные в электронную таблицу STATGRAPHICS. Сохраняем их в файле под именем appendix.

Для проведения дискриминантного анализа выбираем Special | Multivariate Methods | Discriminant Analysis. Получаем окно диалога дискриминантного анализа и вводим в поле Classification Factor (классифицирующий фактор) переменную с именем gro up, в поле Data (данные) — переменные x1, x2, x3, x4, x5 x6, x7 и x8 (Рис. 6. 11).

Рис. 6. 11. Окно диалога дискриминантного анализа

Нажимаем OK. На экран выдается сводка дискриминантного анализа (Рис. 6. 12).

Рис. 6. 12. Сводка дискриминантного анализа

Таблица содержит характеристики трех выделенных дискриминантных функций (Discriminant Function): собственные значения (Eigenvalue), вклад каждой функции в объяснение дисперсии симптомов (Relative Percentage) в %, канонические корреляции с классифицирующим фактором (Canonical Correlation) и оценки уровня значимости дискриминантных функций по критериям Лямбда и Хи‑квадрат. Как следует из приведенных цифр, для решения диагностической задачи достаточно применить две дискриминантные функции F1 и F2, на которые в сумме приходится 98,33 % дисперсии симптомов.

Нажмем кнопку табличных опций (вторая слева вверху) и установим флажок Discriminant Functions. Нажмем OK. Получаем таблицы, показанные на Рис. 6. 13.

Первая таблица содержит коэффициенты трех дискриминантных функций в стандартизированном виде. Для расчета по этим функциям в них следует подставлять стандартизированные значения исходных признаков. Вторая таблица включает константы и коэффициенты дискриминантных функций F1 и F2, в которые вводятся натуральные значения признаков:

F1= – 6,05 + 0,67×x1 + 0,33×x2 + 0,34×x3 + 0,46×x4 + 0,66×x5 + 0,73×x6 + 0,45×x7 + 0,8×x8

F2= 0,12 – 0,17×x1 + 0,97×x2 – 1,03×x3 – 0,71×x4 + 0,26×x5 – 0,04×x6 + 0,33×x7 – 0,31×x8

Рис. 6. 13. Коэффициенты дискриминантных функций

Вызовем еще раз окно табличных опций и попросим выдать на экран результаты расчета координат центроидов групп, а также групповых статистик. Результаты отображены на нижеследующих рисунках.

Рис. 6. 14. Значения групповых центроидов

По данным табл. 6. 29 можно уяснить, каковы средние значения симптомов в каждой группе больных и какова их вариация относительно средних. Видно, что по отдельно взятым разрозненным симптомам невозможно добиться постановки удовлетворительного диагноза. Здесь налицо многомерная диагностическая задача, когда только совокупное взаимодействие признаков способно в той или иной степени отражать разбиение объектов на классы по актуальному критерию.

Для графического отображения результатов нажмем кнопку графических опций (третья слева вверху) и в предоставленном окне диалога закажем график дискриминантных функций (Discriminant Functions). Получаем Рис. 6. 15.

Рис. 6. 15. Значения групповых статистик

Рис. 6. 16. Диаграмма рассеивания объектов на плоскости первых двух дискриминантных функций

На диаграмме рассеивания хорошо видно, что объекты 4‑го класса (неподтвержденный диагноз) образуют самостоятельную, четко выраженную группировку, не пересекающуюся с другими классами. В то же время, остальные классы имеют значительные пересечения в пространстве дискриминантных функций. В принципе уже по этой картине можно составить диагностическое правило. Оно будет заключаться в вычислении расстояния от диагностируемого объекта до центроидов классов в пространстве канонических дискриминантных функций. Вместе с тем, более точные результаты диагностики дает применение линейных дискриминантных функций Фишера, параметры которых также определяются в рамках процедуры дискриминантного анализа STATGRAPHICS. Они здесь имеют название классифицирующих функций (Classification Functions). Они были охарактеризованы выше.

Доступ к классифицирующим функциям осуществляется через окно диалога задания табличных опций. Ниже приводятся полученные параметры этих функций.

Рис. 6. 17. Коэффициенты классифицирующих функций

Для количественного выражения результатов применения классифицирующих функций обратимся снова к окну диалога задания табличных опций (нажав вторую слева кнопку) и установим флажок Classification Table. Нажимаем OK. Получаем две таблицы (Рис. 6. 18)

Рис. 6. 18. Сводные результаты классификации

Рис. 6. 19. Детальный разбор результатов применения классифицирующих функций

Из верхней таблицы черпаем сведения об итоговых результатах диагностики острого аппендицита. Точность диагностики больных первой группы (гангренозный аппендицит) составляет 78,57 %, второй группы (флегмонозный аппендицит) — 64 % и третьей группы (катаральный аппендицит) — 65,38 %. Это не слишком точные результаты, которые, однако, могут в какой‑то мере содействовать окончательному заключению клинического специалиста. Вместе с тем, констатация отсутствия острого аппендицита (группа 4 — неподтвержденный диагноз) осуществляется со 100% надежностью, что следует считать определенным достижением в применении методов дискриминантного анализа для решения практически важных задач медицинской диагностики.

Во второй таблице дается детальный разбор результатов диагностики посредством полученных классифицирующих функций. Для каждого объекта приведены значения двух наибольших дискриминантных функций и результат отнесения к тому или иному классу. Неправильно классифицированные объекты помечены звездочкой. Это дает пищу для дополнительных размышлений о причине неудачных автоматических диагнозов.


Дата добавления: 2021-03-18; просмотров: 103; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!