Лабораторнаяработа № 3. Однофакторный дисперсионный анализ



Цель работы. Изучение однофакторного дисперсионного анализа, овладение инструментом однофакторного дисперсионного анализа в MSExcel 2010.

Краткие сведения.

Однофакторный дисперсионный анализ. При исследовании зависимостей одной из наиболее простых является ситуация, когда рассматривается влияние на изучаемую числовую величину (изучаемый признак)  только одного фактора, принимающего конечное число значений. Фактор, влияние которого изучается, может иметь качественный или количественный характер. Значения фактора называются уровнем фактора или способом обработки. Значения изучаемого признака называют откликом. Пусть фактор  имеет  уровней , при каждом уровне фактора произведены несколько измерений отклика, – значение отклика (изучаемого признака) в -ом измерении при уровне фактора ,  – число измерений отклика при -ом уровне фактора, общее число наблюдаемых (выборочных) значений изучаемого признака . Выборочные данные представляются в виде следующей таблицы.

Таблица 3.1

Уровни фактора

Результаты измерений отклика

Выборочные данные, сгруппированные по уровням фактора , расположены в столбцах таблицы 3.1.

При изменении уровня фактора наибольшей изменчивости, как правило, подвержено положение (среднее, медиана) случайной величины (изучаемого признака). В однофакторных задачах предполагается, что выборочные данные , , …,  при разных уровнях фактора принадлежат некоторому сдвиговому семейству распределений. Часто в качестве такого сдвигового семейства распределений рассматривается семейство нормальных распределений. Различие выборочных данных при разных уровнях фактора может быть объяснено действием чистой случайности, что означает принадлежность всех данных одному и тому же распределению. Это предположение именуют нулевой гипотезой . Если это предположение верно, то нет влияния фактора на изучаемый признак. В противном случае, при наличии влияния фактора, возникает задача оценки эффектов уровней фактора. Совокупность статистических методов проверки нулевой гипотезы и оценки эффектов уровней фактора, в предположении принадлежности выборочных данных семейству нормальных распределений, называется дисперсионным анализом.

Модель однофакторного дисперсионного анализа. Для описания данных таблицы 3.1 используется аддитивная модель

, ( ),                  (3.1)

которая показывает, на какие компоненты раскладывается значение изучаемого признака.  – неслучайная величина, являющаяся результатом действия j-го уровня фактора (эффект j-го уровня фактора);  – случайная величина, отражающая внутренне присущую наблюдениям изменчивость (ошибка, вызванная влиянием других неучтенных факторов).

Модель (3.1) может быть представлена в виде

, ( ),                  (3.2)

где  – общая (генеральная) средняя изучаемого признака,  – неслучайная величина отражающая эффект j-го уровня фактора, ,  – случайная ошибка.

Предпосылки однофакторного дисперсионного анализа:

· Математические ожидания ошибок  равны нулю, т.е.

· Ошибки  взаимно независимы;

· Дисперсии ошибок , следовательно, и величин , одинаковые для любых , т.е. ;

· Все ошибки  распределены по нормальному закону .

При выполнении предпосылок однофакторного дисперсионного анализа нулевая гипотеза об отсутствии влияния фактора на изучаемый признак выражается в равенстве эффектов уровней фактора  (групповых средних), и для модели (3.1) имеет вид

,

а для модели (3.2)

.

Гипотеза о равенстве групповых средних нормальных совокупностей с одинаковыми дисперсиями  равносильна гипотезе о равенстве факторной (межгрупповой) и остаточной (внутригрупповой) дисперсий. Эти дисперсии в этом случае равны общей (генеральной) дисперсии . При равенстве групповых средних выборочная факторная  и выборочная остаточная  дисперсии являются независимыми несмещенными оценками одной и той же генеральной дисперсии  и их различие незначимо. Здесь  – выборочное групповое среднее (среднее при j-ом уровне фактора),  – выборочная общая средняя изучаемого признака. Таким образом, проверка нулевой гипотезы , при уровне значимости , сводится к проверке существенности различия несмещенных выборочных оценок  и дисперсии  с помощью F-критерия  , который имеет F-распределение Фишера-Снедекора с  и  степенями свободы.

Гипотеза  об отсутствии влияния фактора  на исследуемый признак  принимается, если вычисленное значение статистики меньше критического  В этом случае выборочные данные при разных уровнях фактора принадлежат одному и тому же нормальному распределению и общая выборочная средняя  и выборочная остаточная дисперсия  являются несмещенными оценками математического ожидания и дисперсии  этого распределения.  – квантиль уровня -распределения Фишера-Снедекора с  и степенями свободы.

Если , то гипотеза  отвергается, т.е. фактор  оказывает существенное влияние на исследуемый признак. В этом случае выборочные данные при разных уровнях фактора принадлежат различным нормальным распределениямN( ), групповые выборочные средние  являются точечными оценками математических ожиданий  этих распределений (т.е. эффектов уровней фактора). Доверительные интервалы для эффектов уровней фактора (математических ожиданий ) надежности  имеют вид

 ,                 (3.3)

где  – квантиль уровня  распределения Стьюдента с числом степеней свободы равным .


Дата добавления: 2018-04-15; просмотров: 715; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!