Дисперсионный анализ факторов
Nbsp;
В. В. Ефимов
СТАТИСТИЧЕСКИЕ МЕТОДЫ
В УПРАВЛЕНИИ КАЧЕСТВОМ ПРОДУКЦИИ
Учебное пособие
Факторный анализ
Основныепонятия
Факторный анализ – статистический метод, используемый при обработке больших массивов экспериментальных данных. Цель факторного анализа: сократить число переменных (редукция данных) и определить структурувзаимосвязей между ними. Можно также сказать, что в задачи факторного анализа входит структурная классификация переменных.
Важным отличием факторного анализа от других статистических мето- дов является в том, что его нельзя применять для обработки первичных, или как говорят «сырых», экспериментальных данных, т.е. полученных непо- средственно при обследовании испытуемого объекта[25].
Материалами для факторного анализа служат корреляционные связи, а точнее, коэффициенты корреляции Пирсона, которые вычисляются между переменными показателями (параметрами), включенными в обследование. Таким образом, факторному анализу подвергаются корреляционные матри- цы, или, как их называют иначе, матрицы интеркорреляций. Наименования столбцов и строк в этих матрицах одинаковы, так как они представляют со- бой перечень переменных, включенных в анализ. Матрицы интеркорреляций всегда квадратные, т.е. число строк в них равно числу столбцов, и симмет- ричные, т.е., на главной диагонали матрицы стоят одни и те же коэффици- енты корреляции.В табл.2.1 приведен пример такой матрицы.
|
|
Таблица 2.1
\ | А | Б | В | Г | Д |
А | 1,0 | 0,2 | 0,7 | 0 | 0,9 |
Б | 0,2 | 1,0 | 0,1 | 0,9 | 0 |
В | 0,7 | 0,1 | 1,0 | 0,6 | 0,4 |
Г | 0 | 0,9 | 0,6 | 1,0 | 0,8 |
Д | 0,9 | 0 | 0,4 | 0,8 | 1,0 |
Очевидно, что если коэффициент корреляции (rk) между какими-то пока- зателями равен нулю, то эти показатели независимы друг от друга, при ко- эффициентах корреляции от 0,3 до 0,4 – слабая корреляция (зависимость), при rk = 0,5 –0,75 – хорошая корреляция, при 0,8-0,95 – очень хорошая кор- реляция, при rk = 1 – зависимостьдетерминированная.
Следует отметить, что исходная таблица данных может состоять из лю- бого числа строк и столбцов, но матрица интеркорреляций должна быть квадратной, так как и в столбцах, и в строках записываются одни и те же по- казатели.
Главное понятие факторного анализа - фактор. Это искусственный ста- тистический показатель, возникающий в результате специальных преобразо- ваний таблицы коэффициентов корреляций. Процедура извлечения факторов из матрицы интеркорреляций называется факторизацией матрицы. В резуль- тате факторизации из корреляционной матрицы может быть извлечено раз- ное количество факторов, но не превышающее числа показателей (строк или столбцов) матрицы. Однако факторы, выявляемые в результате факторизации, как правило, неравноценны по своему значению. Элементы факторной матрицы – коэффициенты корреляции - часто называются «факторными на- грузками», или «факторными весами».
|
|
Сущность факторного анализа
Для того чтобы лучше усвоить сущность факторного анализа, разберем более подробно следующий пример.
При разработке нового автомобиля необходимо выработать потреби- тельские требования к конструкции его дверей. Допустим, что при коллек- тивной выработке потребительских требований к конструкции двери предпо- лагаемого к выпуску автомобиля покупателями высказаны следующие тре- бования:
- дверь должна легко открываться(Т1),
- дверь не должна пропускать пыли(Т2),
- дверь должна быть четко зафиксирована при ее полном открытии(Т3),
- дверь не должна пропускать дорожного шума(Т4),
- дверь должна легко закрываться, без сильного хлопка(Т5),
- дверь должна быть четко пригнана к кузову(Т6),
- дверь не должна ржаветь(Т7).
В реальной ситуации было высказано значительно большее число тре- бований, но для примера приведенного количества потребительских требова- ний достаточно. Нарисуем таблицу попарных корреляций rk (матрицу ин- теркорреляций) между потребительскими требованиями к дверям автомобиля (табл.2.2):
|
|
Таблица 2.2
\ | Т1 | Т2 | Т3 | Т4 | Т5 | Т6 | Т7 |
Т1 | 1,0 | 0,2 | 0,8 | 0,3 | 0,7 | 0,4 | 0 |
Т2 | 0,2 | 1,0 | 0 | 0,9 | 0,4 | 0,8 | 0,1 |
Т3 | 0,8 | 0 | 1,0 | 0 | 0,7 | 0,3 | 0 |
Т4 | 0,3 | 0,9 | 0 | 1,0 | 0,3 | 0,8 | 0 |
Т5 | 0,7 | 0,4 | 0,7 | 0,3 | 1,0 | 0,4 | 0,1 |
Т6 | 0,4 | 0,8 | 0,3 | 0,8 | 0,4 | 1,0 | 0,1 |
Т7 | 0 | 0,1 | 0 | 0,1 | 0,1 | 0,1 | 1,0 |
Коэффициенты корреляции отражают сродство между собой потреби- тельских требований.
При анализе величин коэффициентов корреляции rk легко выделить группы требований, хорошо взаимоувязанных, т.е. имеющих общее предна- значение, кроме самого понятия «двери». Назовем эти группы:А - дверь должна быть удобна в эксплуатации (требования Т1, Т3, Т5), Б - дверь должна быть герметична (требования Т2, Т4, Т6).
Очевидно, что требование Т7 (нержавеющий материал обшивки двери)– очень важное, но оно относится к материалу двери и имеет слабое отноше- ния к конструкциидвери. Скорее всего, это требование попадет в общие требования по автомобилю в следующем виде: металлическая обшивка авто- мобиля должна быть выполнена из нержавеющих материалов.
Таким образом, содержательный анализ всех требований показал, что шесть из них характеризуют два обобщенных требования: удобство в эксплуа- тации и герметичность. Назовем эти обобщенные требования факторами и применим к ним факторный анализ.
|
|
Представим в табл.2.3 эти два фактора А и Б в виде столбцов, а перемен- ные (потребительские требования) - в виде строк. При этом каждому фактору в строке будет соответствовать среднее значение коэффициента корреляции соответствующих переменных по этому фактору. Как было отмечено выше, коэффициенты корреляции в факторной матрице (табл. 2.3) называются фак- торными нагрузками (весами).
Таблица 2.3
Переменная | ФакторА | ФакторБ |
Т1 | 0,83 | 0,30 |
Т2 | 0,30 | 0,90 |
Т3 | 0,83 | 0,10 |
Т4 | 0,40 | 0,90 |
Т5 | 0,80 | 0,40 |
Т6 | 0,35 | 0,87 |
Т7 | 0 | 0,1 |
Как видно из табл.2.3, факторные нагрузки (или веса) А и Б для различ- ных потребительских требований значительно отличаются. Факторная на- грузка А для требования Т1 соответствует тесноте связи, характеризующейся коэффициентом корреляции, равным 0,83. т.е. хорошая (тесная) зависимость. Факторная нагрузка Б для того же требования дает rk =0,3, что соответствует слабой тесноте связи. Как и предполагалось, фактор Б очень хорошо корре- лируется с потребительскими требованиями Т2, Т4 и Т6.
Учитывая, что факторная нагрузка А, так же как и факторная нагрузка Б, влияют на не относящиеся в их группу потребительские требования с тесно- той связи не более 0,4 (то есть слабо), то можно считать, что представленная выше матрица интеркорреляций (табл.2.2) определяется двумя независимы- ми факторами, которые в свою очередь определяют шесть потребительских требований (за исключением Т7).
ПеременнуюТ7можнобыловыделитьвсамостоятельныйфактор,таккак ни с одним потребительским требованием она не имеет значимой корреляци- онной нагрузки (более 0,4). Но, на наш взгляд, это не следует делать, так как фактор «дверь не должна ржаветь» не имеет непосредственного отношения к потребительским требованиям по конструкциидвери.
Таким образом, при утверждении технического задания на проектирова- ние конструкции дверей автомобиля именно названия полученных факторов будут вписаны как потребительские требования, по которым необходимо найти конструктивное решение в виде инженерных характеристик.
Дисперсионный анализ факторов
Укажем на одно принципиально важное свойство коэффициента корре- ляции между переменными: возведенный в квадрат он показывает, какая часть дисперсии (разброса) признака является общей для двух переменных. Или, говоря проще, насколько сильно эти переменные перекрываются. Так например, если две переменные Т1 и Т3 с корреляцией 0,8 перекрываются со степенью 0,64 (0,8 в квадрате), то это означает, что 64% дисперсии той и дру- гой переменной являются общими, т.е. совпадают. Можно также сказать, что общностьэтих переменных равна 64%.
Напомним, что факторные нагрузки в факторной матрице (табл.2.3) яв- ляются тоже коэффициентами корреляции, но между факторами и перемен- ными (потребительскими требованиями). Поэтому возведенная в квадрат факторная нагрузка (дисперсия) характеризует степень общности (или пере- крытия) данной переменной и данного фактора. Определим степень пере- крытия (дисперсию D ) обоих факторов с переменной (потребительским требованием) Т1. Для этого необходимо вычислить сумму квадратов весов факторов с первой переменной, т.е. 0,83•0,83 + 0,3•0,3 = 0,70. Таким образом общность переменной Т1 с обоими факторами составляет 70%. Это доста- точно значимое перекрытие.
В то же время, низкая общность может свидетельствовать о том, что пе- ременная измеряет или отражает нечто, качественно отличающееся от других переменных, включенных в анализ. Это подразумевает, что данная перемен- ная не совмещается с факторами по одной из причин: либо переменная из- меряет другое понятие (как, например, переменная Т7), либо переменная имеет большую ошибку измерения, либо существуют искажающие диспер- сию признаки.
Следует отметить, что значимость каждого фактора также определяется величиной дисперсии между переменными и факторной нагрузкой (весом). Для того чтобы вычислить собственное значение фактора, нужно найти в ка- ждом столбце факторной матрицы (табл.2.3) сумму квадратов факторной на-
21
грузки для каждой переменной. Таким образом, например, дисперсия факто- ра А (DA ) составит 2,42 = 0,83•0,83 + 0,3•0,3 + 0,83•0,83 + 0,4•0,4 + 0,8•0,8 +
0,35•0,35. Расчет значимости фактора Б показал, что DБ = 2,64, т.е. значи- мость фактора Б выше, чем фактораА.
Если собственное значение фактора разделить на число переменных (в нашем примере их 7), то полученная величина покажет, какую долю дис- персии (или объем информации) γ в исходной корреляционной матрице со- ставит этот фактор. Для фактора А γ =0,34 (34%), а для фактора Б – γ = 0,38 (38%). Просуммировав результаты, получим 72%. Таким образом, два факто- ра, будучи объединены, заполняют только 72% дисперсии показателей ис- ходной матрицы. Это означает, что в результате факторизации часть инфор- мации в исходной матрице была принесена в жертву построения двухфак- торной модели. В результате – упущено 28% информации, которая могла бы восстановиться, если бы была принята шестифакторнаямодель.
Где же допущена ошибка, учитывая, что все рассмотренные переменные, имеющие отношение к требованиям по конструкции двери, учтены? Наибо- лее вероятно, что значения коэффициентов корреляции переменных, относя- щихся к одному фактору, несколько занижены. С учетом проведенного ана- лиза можно было бы вернуться к формированию иных значений коэффици- ентов корреляции в матрице интеркорреляций (таблица 2.2).
На практике часто сталкиваются с ситуацией, что число независимых факторов достаточно велико, чтобы их всех учесть в решении проблемы или с технической или экономической точки зрения. Существует ряд способов по ограничению числа факторов. Наиболее известный из них – анализ Парето. При этом отбираются те факторы (по мере уменьшения значимости), которые попадают в (80-85)% границу их суммарнойзначимости.
Факторный анализ можно использовать при реализации метода структу- рирования функции качества (QFD), широко применяемого за рубежом при формировании технического задания на новое изделие.
Дата добавления: 2018-02-15; просмотров: 473; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!