Дисперсионный анализ факторов



Nbsp;

В. В. Ефимов

СТАТИСТИЧЕСКИЕ МЕТОДЫ

В УПРАВЛЕНИИ КАЧЕСТВОМ ПРОДУКЦИИ

Учебное пособие

Факторный анализ

Основныепонятия

Факторный анализ – статистический метод, используемый при обработке больших массивов экспериментальных данных. Цель факторного анализа: сократить число переменных (редукция данных) и определить структурувзаимосвязей между ними. Можно также сказать, что в задачи факторного анализа входит структурная классификация переменных.

Важным отличием факторного анализа от других статистических мето- дов является в том, что его нельзя применять для обработки первичных, или как говорят «сырых», экспериментальных данных, т.е. полученных непо- средственно при обследовании испытуемого объекта[25].

Материалами для факторного анализа служат корреляционные связи, а точнее, коэффициенты корреляции Пирсона, которые вычисляются между переменными показателями (параметрами), включенными в обследование. Таким образом, факторному анализу подвергаются корреляционные матри- цы, или, как их называют иначе, матрицы интеркорреляций. Наименования столбцов и строк в этих матрицах одинаковы, так как они представляют со- бой перечень переменных, включенных в анализ. Матрицы интеркорреляций всегда квадратные, т.е. число строк в них равно числу столбцов, и симмет- ричные, т.е., на главной диагонали матрицы стоят одни и те же коэффици- енты корреляции.В табл.2.1 приведен пример такой матрицы.

Таблица 2.1

\ А Б В Г Д
А 1,0 0,2 0,7 0 0,9
Б 0,2 1,0 0,1 0,9 0
В 0,7 0,1 1,0 0,6 0,4
Г 0 0,9 0,6 1,0 0,8
Д 0,9 0 0,4 0,8 1,0

 

Очевидно, что если коэффициент корреляции (rk) между какими-то пока- зателями равен нулю, то эти показатели независимы друг от друга, при ко- эффициентах корреляции от 0,3 до 0,4 – слабая корреляция (зависимость), при rk = 0,5 –0,75 – хорошая корреляция, при 0,8-0,95 – очень хорошая кор- реляция, при rk = 1 – зависимостьдетерминированная.

Следует отметить, что исходная таблица данных может состоять из лю- бого числа строк и столбцов, но матрица интеркорреляций должна быть квадратной, так как и в столбцах, и в строках записываются одни и те же по- казатели.

Главное понятие факторного анализа - фактор. Это искусственный ста- тистический показатель, возникающий в результате специальных преобразо- ваний таблицы коэффициентов корреляций. Процедура извлечения факторов из матрицы интеркорреляций называется факторизацией матрицы. В резуль- тате факторизации из корреляционной матрицы может быть извлечено раз- ное количество факторов, но не превышающее числа показателей (строк или столбцов) матрицы. Однако факторы, выявляемые в результате факторизации, как правило, неравноценны по своему значению. Элементы факторной матрицы – коэффициенты корреляции - часто называются «факторными на- грузками», или «факторными весами».

 

Сущность факторного анализа

Для того чтобы лучше усвоить сущность факторного анализа, разберем более подробно следующий пример.

При разработке нового автомобиля необходимо выработать потреби- тельские требования к конструкции его дверей. Допустим, что при коллек- тивной выработке потребительских требований к конструкции двери предпо- лагаемого к выпуску автомобиля покупателями высказаны следующие тре- бования:

- дверь должна легко открываться(Т1),

- дверь не должна пропускать пыли(Т2),

- дверь должна быть четко зафиксирована при ее полном открытии(Т3),

- дверь не должна пропускать дорожного шума(Т4),

- дверь должна легко закрываться, без сильного хлопка(Т5),

- дверь должна быть четко пригнана к кузову(Т6),

- дверь не должна ржаветь(Т7).

В реальной ситуации было высказано значительно большее число тре- бований, но для примера приведенного количества потребительских требова- ний достаточно. Нарисуем таблицу попарных корреляций rk (матрицу ин- теркорреляций) между потребительскими требованиями к дверям автомобиля (табл.2.2):

Таблица 2.2

 

\ Т1 Т2 Т3 Т4 Т5 Т6 Т7
Т1 1,0 0,2 0,8 0,3 0,7 0,4 0
Т2 0,2 1,0 0 0,9 0,4 0,8 0,1
Т3 0,8 0 1,0 0 0,7 0,3 0
Т4 0,3 0,9 0 1,0 0,3 0,8 0
Т5 0,7 0,4 0,7 0,3 1,0 0,4 0,1
Т6 0,4 0,8 0,3 0,8 0,4 1,0 0,1
Т7 0 0,1 0 0,1 0,1 0,1 1,0

 

Коэффициенты корреляции отражают сродство между собой потреби- тельских требований.

При анализе величин коэффициентов корреляции rk легко выделить группы требований, хорошо взаимоувязанных, т.е. имеющих общее предна- значение, кроме самого понятия «двери». Назовем эти группы:А - дверь должна быть удобна в эксплуатации (требования Т1, Т3, Т5), Б - дверь должна быть герметична (требования Т2, Т4, Т6).

Очевидно, что требование Т7 (нержавеющий материал обшивки двери)– очень важное, но оно относится к материалу двери и имеет слабое отноше- ния к конструкциидвери. Скорее всего, это требование попадет в общие требования по автомобилю в следующем виде: металлическая обшивка авто- мобиля должна быть выполнена из нержавеющих материалов.

Таким образом, содержательный анализ всех требований показал, что шесть из них характеризуют два обобщенных требования: удобство в эксплуа- тации и герметичность. Назовем эти обобщенные требования факторами и применим к ним факторный анализ.

Представим в табл.2.3 эти два фактора А и Б в виде столбцов, а перемен- ные (потребительские требования) - в виде строк. При этом каждому фактору в строке будет соответствовать среднее значение коэффициента корреляции соответствующих переменных по этому фактору. Как было отмечено выше, коэффициенты корреляции в факторной матрице (табл. 2.3) называются фак- торными нагрузками (весами).

Таблица 2.3

Переменная ФакторА ФакторБ
Т1 0,83 0,30
Т2 0,30 0,90
Т3 0,83 0,10
Т4 0,40 0,90
Т5 0,80 0,40
Т6 0,35 0,87
Т7 0 0,1

 

Как видно из табл.2.3, факторные нагрузки (или веса) А и Б для различ- ных потребительских требований значительно отличаются. Факторная на- грузка А для требования Т1 соответствует тесноте связи, характеризующейся коэффициентом корреляции, равным 0,83. т.е. хорошая (тесная) зависимость. Факторная нагрузка Б для того же требования дает rk =0,3, что соответствует слабой тесноте связи. Как и предполагалось, фактор Б очень хорошо корре- лируется с потребительскими требованиями Т2, Т4 и Т6.

Учитывая, что факторная нагрузка А, так же как и факторная нагрузка Б, влияют на не относящиеся в их группу потребительские требования с тесно- той связи не более 0,4 (то есть слабо), то можно считать, что представленная выше матрица интеркорреляций (табл.2.2) определяется двумя независимы- ми факторами, которые в свою очередь определяют шесть потребительских требований (за исключением Т7).


ПеременнуюТ7можнобыловыделитьвсамостоятельныйфактор,таккак ни с одним потребительским требованием она не имеет значимой корреляци- онной нагрузки (более 0,4). Но, на наш взгляд, это не следует делать, так как фактор «дверь не должна ржаветь» не имеет непосредственного отношения к потребительским требованиям по конструкциидвери.

Таким образом, при утверждении технического задания на проектирова- ние конструкции дверей автомобиля именно названия полученных факторов будут вписаны как потребительские требования, по которым необходимо найти конструктивное решение в виде инженерных характеристик.

 

Дисперсионный анализ факторов

Укажем на одно принципиально важное свойство коэффициента корре- ляции между переменными: возведенный в квадрат он показывает, какая часть дисперсии (разброса) признака является общей для двух переменных. Или, говоря проще, насколько сильно эти переменные перекрываются. Так например, если две переменные Т1 и Т3 с корреляцией 0,8 перекрываются со степенью 0,64 (0,8 в квадрате), то это означает, что 64% дисперсии той и дру- гой переменной являются общими, т.е. совпадают. Можно также сказать, что общностьэтих переменных равна 64%.

Напомним, что факторные нагрузки в факторной матрице (табл.2.3) яв- ляются тоже коэффициентами корреляции, но между факторами и перемен- ными (потребительскими требованиями). Поэтому возведенная в квадрат факторная нагрузка (дисперсия) характеризует степень общности (или пере- крытия) данной переменной и данного фактора. Определим степень пере- крытия (дисперсию D ) обоих факторов с переменной (потребительским требованием) Т1. Для этого необходимо вычислить сумму квадратов весов факторов с первой переменной, т.е. 0,83•0,83 + 0,3•0,3 = 0,70. Таким образом общность переменной Т1 с обоими факторами составляет 70%. Это доста- точно значимое перекрытие.

В то же время, низкая общность может свидетельствовать о том, что пе- ременная измеряет или отражает нечто, качественно отличающееся от других переменных, включенных в анализ. Это подразумевает, что данная перемен- ная не совмещается с факторами по одной из причин: либо переменная из- меряет другое понятие (как, например, переменная Т7), либо переменная имеет большую ошибку измерения, либо существуют искажающие диспер- сию признаки.

Следует отметить, что значимость каждого фактора также определяется величиной дисперсии между переменными и факторной нагрузкой (весом). Для того чтобы вычислить собственное значение фактора, нужно найти в ка- ждом столбце факторной матрицы (табл.2.3) сумму квадратов факторной на-

21


грузки для каждой переменной. Таким образом, например, дисперсия факто- ра А (DA ) составит 2,42 = 0,83•0,83 + 0,3•0,3 + 0,83•0,83 + 0,4•0,4 + 0,8•0,8 +

0,35•0,35. Расчет значимости фактора Б показал, что DБ = 2,64, т.е. значи- мость фактора Б выше, чем фактораА.

Если собственное значение фактора разделить на число переменных (в нашем примере их 7), то полученная величина покажет, какую долю дис- персии (или объем информации) γ в исходной корреляционной матрице со- ставит этот фактор. Для фактора А γ =0,34 (34%), а для фактора Б – γ = 0,38 (38%). Просуммировав результаты, получим 72%. Таким образом, два факто- ра, будучи объединены, заполняют только 72% дисперсии показателей ис- ходной матрицы. Это означает, что в результате факторизации часть инфор- мации в исходной матрице была принесена в жертву построения двухфак- торной модели. В результате – упущено 28% информации, которая могла бы восстановиться, если бы была принята шестифакторнаямодель.

Где же допущена ошибка, учитывая, что все рассмотренные переменные, имеющие отношение к требованиям по конструкции двери, учтены? Наибо- лее вероятно, что значения коэффициентов корреляции переменных, относя- щихся к одному фактору, несколько занижены. С учетом проведенного ана- лиза можно было бы вернуться к формированию иных значений коэффици- ентов корреляции в матрице интеркорреляций (таблица 2.2).

На практике часто сталкиваются с ситуацией, что число независимых факторов достаточно велико, чтобы их всех учесть в решении проблемы или с технической или экономической точки зрения. Существует ряд способов по ограничению числа факторов. Наиболее известный из них – анализ Парето. При этом отбираются те факторы (по мере уменьшения значимости), которые попадают в (80-85)% границу их суммарнойзначимости.

Факторный анализ можно использовать при реализации метода структу- рирования функции качества (QFD), широко применяемого за рубежом при формировании технического задания на новое изделие.

 


Дата добавления: 2018-02-15; просмотров: 187;