Стадии дискриминантного анализа



Выполнение дискриминантного анализа включает следующие стадии: формулирование проблемы, вычисление коэффициентов дискриминантной функции, определение значимости, интерпретация и проверка достоверности (рис. 1). Эти стадии обсуждаются и иллюстрируются для дискриминантного анализа двух групп.

Формулирование проблемы

Первый шаг дискриминантного анализа — формулирование проблемы с помощью определения целей, зависимой переменой и независимых переменных. Зависимая переменная должна состоять из двух или больше взаимоисключающих и взаимно исчерпывающих категорий. Если зависимая переменная измерена с помощью интервальной или относительной шкалы, то ее следует в первую очередь перевести в статус категориальной.

Следующий шаг — разделение выборки на две части. Одна из них — анализируемая выборка— используется для вычисления дискриминантной функции.

Анализируемая выборка. Часть общей выборки, которую используют для вычисления дискриминантной функции.

Другая часть — проверочная выборка— предназначена для проверки дискриминантной функции.

Проверочная выборка. Часть общей выборки, которую используют для проверки результатов расчета на основании анализируемой выборки.

Когда выборка достаточно велика, ее можно разбить на две равные части. Одна служит анализируемой выборкой, а другую используют для проверки. Затем роль этих половинок взаимно меняют и повторяют анализ. Это называется двойной перекрестной проверкой, и она аналогична методу в регрессионном анализе.

Часто распределение количества случаев в анализируемой и проверочной выборках следует из распределения в общей выборке.

И наконец, проверку достоверности дискриминантной функции предлагают выполнять неоднократно. Каждый раз выборку следует разбивать на две части — для анализа и проверки. Вычисляют дискриминантную функцию и выполняют анализ достоверности модели. Таким образом, оценка достоверности основана на ряде испытаний.

 

 

Заключение

Дискриминантный анализ так же, как и кластерный анализ, относится к методам многомерной классификации, но при этом базируется на иных предпосылках. Основное отличие заключается в том, что в ходе дискриминантного анализа новые кластеры не образуются, а формулируется правило, по которому новые единицы совокупности относятся к одному из уже существующих множеств (классов). Основанием для отнесения каждой единицы совокупности к определенному множеству служит величина дискриминантной функции, рассчитанная по соответствующим значениям дискриминантных переменных.

Основными проблемами дискриминантного анализа являются, во-первых, определение набора дискриминантных переменных, Bo-вторых, выбор вида дискриминантной функции. Существуют различные критерии последовательного отбора переменных, позволяющих получить наилучшее различение множеств. После уточнения оптимального набора дискриминантных переменных исследователю предстоит решить вопрос о выборе вида дискриминантной функции, Т.е. выбрать вид разделяющей поверхности. Чаще всего на практике применяют линейный дискриминантный анализ. В этом случае дискриминантная функция представляет собой либо прямую, либо плоскость (гиперплоскость).

Линейная дискриминантная функция не всегда подходит в качестве описания разделяющей поверхности между множествами. Например, в тех случаях, когда различаемые множества не являются выпуклыми, правомерно предположить, что дискриминантная функция, приводящая к наименьшим ошибкам классификации, не может быть линейной.

Если множества, используемые в качестве обучающих выборок, близко расположены друг к другу, то возрастает вероятность ошибочной классификации новых объектов, особенно в тех случаях, когда классифицируемый объект сильно удален от центров обоих множеств. Складывается ситуация, при которой распознавание объекта затруднено. Дискриминантный анализ можно использовать как метод прогнозирования (предсказания) поведения наблюдаемых единиц статистической совокупности на основе имеющихся стереотипов поведения аналогичных объектов, входящих в состав объективно существующих или сформированных по определенному принципу множеств (обучающих выборок).

Библиографический список

1.Гласс Дж., Стенли Дж. Статистические методы в педагогике и психологии. М., 1976

 

2. Глинский В.В., Ионин В.Г. Статистический анализ данных, М.: Филин, 1998.

 

3. Головина Г.М., Крылов В.Ю., Савченко Т.Н. Математические методы в современной психологии: статус, разработка, применение. М.: Изд-во «Институт психологии РАН», 1995.

 

4. Ким, Дж. О. Факторный, дискриминантный и кластерный анализ / Дж. О. Ким, Ч. У. Мьюллер, пер. с англ. Хотинского. -- М.: Финансы и статистика, 1989. -- 215 с.

5. Многомерные статистические методы. Дубров А.М., Мхитарян В.С., Трошин Л.И. Москва. 2003г.

6.Тарасов С.Г. Основы применения математических методов в психологии.СПб., 1998

7.Терёхина А.Ю. Анализ данных методами многомерного шкалирования. М., 1986. Факторный, дискриманантный и кластерный анализ / Дж.-О.Ким, Ч.У. Мьюллер, У.Р. Клекка и др. М., 1989

 


Дата добавления: 2021-02-10; просмотров: 55; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!