Тема 2.4. Однофакторный дисперсионный анализ



Понятие о дисперсионном анализе

Пусть генеральные совокупности  распределены нормально и имеют одинаковую, хотя и неизвестную дисперсию; математические ожидания также неизвестны, но могут быть различными. Требуется при заданном уровне значимости α по выборочным средним проверить нулевую гипотезу о равенстве всех математических ожиданий: .

Казалось бы, что для решения поставленной задачи, т.е. для сравнения нескольких средних (p > 2), достаточно сравнить их попарно по методике подраздела 2.3.2 настоящего пособия. Однако с возрастанием числа средних возрастает и разброс различий между ними. По этой причине для сравнения нескольких средних пользуются методом, основанным на сравнении дисперсий и поэтому называемым дисперсионным анализом.

На практике дисперсионный анализ применяют, чтобы установить, оказывает ли существенное влияние некоторый качественный фактор , который имеет  уровней  на изучаемую величину Х. Например, если требуется выяснить, какой именно вид удобрений наиболее эффективен для получения наибольшего урожая с участков одинаковой площади, то фактором будет удобрение, а его уровнями – виды удобрения.

Основная идея дисперсионного анализа состоит в сравнении «факторной» дисперсии, обусловленной воздействием только самого фактора, и «остаточной» дисперсии, обусловленной случайными причинами. Если различие между этими дисперсиями значимо, то фактор оказывает ощутимое влияние на величину Х, и в этом случае средние значений, наблюдаемых на каждом уровне фактора (групповые средние) различаются также значимо.

При этом, если установлено, что фактор оказывает существенное влияние на величину Х, и требуется выяснить, какой именно уровень фактора оказывает наибольшее воздействие, то проводят дополнительно попарное сравнение групповых средних по методике подраздела 2.3.2.

 

Факторная и остаточная дисперсии и их отыскание

Пусть на количественный нормально распределенный признак X воздействует фактор , который имеет p постоянных уровней. Будем полагать, что число наблюдений на каждом уровне равно q. Пусть наблюдалось всего  значений  признака X, где:  номер испытания,  номер уровня фактора. Пусть также известны значения групповых средних: , а также значе­ние общей средней: .

 

Общей суммой квадратов отклонений измеренных значений от общей средней называется величина, определяемая формулой:

 

.

 

Факторной суммой квадратов отклонений групповых средних от общей средней называется величина, определяемая формулой:

.

Остаточной суммой квадратов отклонений наблюдаемых значений от групповых средних называется величина, определяемая формулой:

.

 

Замечание 1. На практике обычно остаточную сумму квадратов отклонений находят не по приведенной формуле, а как разность общей и факторной сумм квадратов отклонений, т.е. по формуле: .

Замечание 2. С помощью элементарных преобразований можно получить формулы, гораздо более удобные для практических расчетов и имеющие вид:

,

где:  и  рассчитываются для каждого уровня фактора , а .

 

Введенные нами величины имеют вполне определенный смысл. Так сумма  является характеристикой воздействия фактора  на признак X. Действительно, допустим, что фактор оказывает существенное влияние на признак X, тогда группа наблюдаемых значений признака на одном определенном уровне фактора, вообще говоря, будет отличаться от групп наблюдаемых значений признака на других уровнях фактора. Следовательно, будут различаться и групповые средние, причем они будут тем больше рассеяны вокруг общей средней, чем большим окажется воздействие фактора.

Сумма  отражает влияние случайных воздействий на результаты наблюдений. Действительно, казалось бы, наблюдения одной группы не должны различаться между собой. Однако на признак X кроме фактора  воздействуют и другие (в общем случае многочисленные и малозначащие) случайные факторы, поэтому наблюдения одной и той же группы оказываются различными, а, следовательно, рассеянными вокруг групповой средней.

Подсчитав общую и факторную суммы по приведенным выше формулам, а остаточную сумму – по любой из приведенных формул, можно найти факторную и остаточную дисперсии.

Учитывая, что факторная дисперсия зависит от р составляющих и является смещенной оценкой, формулу для исправленной факторной дисперсии запишем в виде:

.

Остаточная дисперсия зависит от  составляющих и также является смещенной оценкой, поэтому формулу для исправленной остаточной дисперсии запишем в виде:

.

 


Дата добавления: 2018-06-01; просмотров: 337; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!