Однофакторный дисперсионный анализ для несвязанных групп в Excel

Практикум № 12

Однофакторный дисперсионный анализ

Имеется несколько переменных факторов, которые либо упорядочены, либо классифицированы, либо измерены. Требуется установить, влияют ли эти факторы на изучаемую переменную.

Дисперсионным анализом называется исследование влияния переменных факторов на изучаемую переменную по дисперсиям.

 - основное дисперсионное уравнение

Влияние фактора А на переменную Х может быть различным.

  1.  Фактор А влияет только на среднюю величину Х. Тогда дисперсия Dфакт(Х) есть характеристика рассеивания средних значений Х под влиянием А
  2.  А влияет только на рассеяние значений, т.е. на Do(X). Тогда Dфакт(Х) есть добавка, выражающая степень влияния А.
  3.  А влияет и на М(Х), и на Do(X), тогда Dфакт(Х) суммирует эти влияния.

Если имеет место 2 или 3, то влияние фактора можно учесть, применяя как параметрические, так и непараметрические методы, меры корреляции, уравнения регрессии.

Если имеет место 1, то наряду с этими методами применяется дисперсионный анализ.

Пусть в дополнение к фактору А требуется оценить влияние фактора В

1. если факторы А и В независимы

выражают долю рассеяния средних значений переменной Х под влиянием факторов А и В соответственно.

- случайные изменения переменной Х под влиянием других (не А и не В) факторов и называется остаточной дисперсией.

2. если факторы А и В зависимы

DАВ – доля общей дисперсии, обусловленная совместным влиянием факторов А и В

Таким образом, сущность дисперсионного анализа состоит в том, чтобы представить общую дисперсию в виде суммы дисперсий, обусловленных влиянием контролируемых и неконтролируемых факторов и, оценивая дисперсионные отношения, определить меру влияния контролируемых условий на средние значения изучаемой переменной.

Основная задача дисперсионного анализа – из произвольного числа факторов, которые могут влиять на изучаемую переменную, выделить сравнительно небольшое количество факторов, влияющих наиболее существенно

Выделяют три этапа дисперсионного анализа

  1. Оценка общего влияния одного или нескольких факторов на средние значения изучаемой величины.
  2. Исследование специфического действия факторов
  3. Оценка парциального влияния различных комбинаций факторов. Это позволяет обоснованно осуществить выбор между линейной нелинейной аппроксимацией регрессии.

 

Однофакторный дисперсионный анализ для несвязанных групп

Применяется в тех случаях, когда исследуются изменения результативного признака под влиянием изменяющихся условий или градаций одного фактора

Непараметрическим аналогом этого метода является критерий Крускала-Уоллиса

Гипотезы

Но: Различия между градациями фактора являются не более             выраженными, чем случайные различия внутри каждой группы.

Н1: Различия между градациями фактора являются более выраженными, чем случайные различия внутри каждой группы.

Ограничения:

нормальное распределение результирующего признака


 

 

Однофакторный дисперсионный анализ для несвязанных групп в Excel

 

  1. Провести проверку распределения признака.
  2. Занести значения признака (каждая градация фактора в отдельный столбец)
  3. Выбрать последовательность команд Сервис – Анализ данных – Однофакторный дисперсионный анализ

Для рассмотрения однофакторного дисперсионного анализа в MS Excel решим следующий пример.

Пример 3.2.В таблице 3 приведены данные по объемам работ, выполненных на посадке декоративных кустарников за смену для четырех бригад.

 

 

Таблица 1.

Номер бригады Объем выполненной работы Групповое среднее Выборочная смещенная дисперсия
1 140, 144, 142, 145 142,75 3,688
2 150, 149, 152, 152 150,75 1,688
3 148, 149, 146, 147 147,50 1,25
4 150, 155, 154, 152 152,75 3,688

 

Проверить гипотезу дисперсионного анализа H0 о равенстве средних: m1 = m2 = m3= m4.

Решение. Для проверки гипотезы H0 вычислим суммы Q1 и Q2 .

Общее выборочное среднее равно

Тогда

Вычислим статистику Фишера:

По таблицам распределения Фишера для a = 0,05 и степеней свободы k1 =3, k2 = 12 найдем критическое значение Fкр=3,49. Так как F> Fкр, то гипотезу H0 отклоняем, т.е. считаем, что объем ежедневной выработки зависит от работающей бригады. Оценим степень этой зависимости с помощью коэффициента детерминации. Для этого вычислим Q :

Контроль: Q = Q1+Q2 = 228,688 + 41,25 = 269,9 – верно!

По формуле (48) получим: , это означает, что 84,7% общей вариации (изменчивости) ежесменного объема выработки связано с работающей бригадой.

В MS Excel для проведения однофакторного дисперсионного анализа использует­ся процедура Однофакторный дисперсионный анализ.

Для проведения дисперсионного анализа необходимо:

•ввести данные в таблицу, так чтобы в каждом столбце оказались данные, соот­ветствующие одному значению исследуемого фактора, а столбцы располагались в порядке возрастания (убывания) величины исследуемого фактора,

•выполнить команду Сервис > Анализ данных;

•в появившемся диалоговом окне Анализ данныхв списке Инструментыанализа выбрать процедуру Однофакторный дисперсионный анализ, указав курсором мыши и щелкнув левой кнопкой мыши. Затем нажать кнопку ОК;

•в появившемся диалоговом окне задать Входной интервал, то есть ввести ссылку на диапазон анализируемых данных, содержащий все столбцы данных. Для этого следует навести указатель мыши на верхнюю левую ячейку диапазона данных, нажать левую кнопку мыши и, не отпуская ее, протянуть указатель мыши к нижней правой ячейке, содержащей анализируемые данные, затем отпустить левую кнопку мыши;

•в разделе Группировка переключатель установить в положение по столбцам;

•указать Выходной диапазон, то есть ввести ссылку на ячейки, в которые будут выведены результаты анализа. Для этого следует поставить переключатель в положение Выходной интервал (навести указатель мыши и щелкнуть левой кноп­кой), далее навести указатель мыши на правое поле ввода Выходной интервал и щелкнуть левой кнопкой мыши, затем указатель мыши навести на левую верх­нюю ячейку выходного диапазона и щелкнуть левой кнопкой мыши. Размер выходного диапазона будет определен автоматически, и на экран будет выведе­но сообщение в случае возможного наложения выходного диапазона на исход­ные данные.

•нажать кнопку ОК.

Результаты анализа. Выходной диапазон будет включать в себя результаты дис­персионного анализа: средние, дисперсии, критерий Фишера и другие показатели.

Однофакторный дисперсионный анализ      

     

 

     
ИТОГИ    

 

     
Группы Счет Сумма

Среднее

Дисперсия    
Строка 1    

142,75

4,916667    
Строка 2    

150,75

2,25    
Строка 3    

147,5

1,666667    
Строка 4    

152,75

4,916667    
     

 

     
     

 

     
Дисперсионный анализ    

 

     
Источник вариации SS df

MS

F P-Значение F критическое
Между группами 228,6875  

76,22917

22,17576 3,48104E-05 3,490294821
Внутри групп 41,25  

3,4375

     
     

 

     
Итого 269,9375  

 

     
               

 

Как видно из таблицы, общая сумма квадратов SS (Q) = 269,938 разбита на компоненты: Q1= 228,688, обусловленную различием средних значений между группами и Q2= 41,25, обусловленную внутригрупповой изменчивостью

SS (Q)= Q1+Q2 ,

где Q- общая сумма квадратов отклонений наблюдений от общего среднего, Q1- сумма квадратов отклонений выборочных средних от общего среднего, Q2- сумма квадратов отклонений наблюдений от групповых средних.

Заметим, что MS в этой таблице есть средний квадрат, равный SS, деленная на число степеней свободы (df).

MS1 = Q1/ df1 = 228,688 / 3 = 76,229

MS2 = Q2/ df2 = 41,25 / 12 = 3,438

F = MS1 / MS2 = 76,229 / 3,438 = 22,176

Внутригрупповая изменчивость (SS) обычно называется остаточной компонентой или дисперсией ошибки. Это означает, что обычно при проведении эксперимента она не может быть предсказана или объяснена. С другой стороны, SS эффект (или компоненту дисперсии между группами) можно объяснить различием между средними значениями в группах. Иными словами, принадлежность к некоторой группе объясняет межгрупповую изменчивость, т.к. нам известно, что эти группы обладают разными средними значениями.
Интерпретация результатов. Влияние исследуемого фактора определяется по величине значимости критерия Фишера, которая находится в таблице Дисперси­онный анализ на пересечении строки Между группами и столбца Р-Значение. В случаях, когда Р-Значение < 0,05, критерий Фишера значим, и влияние исследуемого фак­тора можно считать доказанным.

Выводы:Подводя итоги, можно сказать, что целью дисперсионного анализа является проверка статистической значимости различия между средними (для групп или переменных). Эта проверка проводится с помощью разбиения суммы квадратов на компоненты, т.е. с помощью разбиения общей дисперсии (вариации) на части, одна из которых обусловлена случайной ошибкой (то есть внутригрупповой изменчивостью), а вторая связана с различием средних значений. Последняя компонента дисперсии затем используется для анализа статистической значимости различия между средними значениями. Если это различие значимо, нулевая гипотеза отвергается и принимается альтернативная гипотеза о существовании различия между средними.

 

 

Задача №1.

Изучалось различие в продуктивности воспроизведения одного и того же материала трех групп испытуемых (по 5 человек), различающихся условиями предъявления этого материала для запоминания. Результаты обследования приведены в таблице.

Условие 1 Условие 2 Условие 3
1 5 8 11
2 4 7 9
3 3 6 7
4 6 9 10
5 7 5 8

Проверить гипотезу о том, что продуктивность воспроизведения материала зависит от условий его предъявления.

Задача №2.

В исследовании измерялась избирательность перцептивного внимания. Материал методики состоит из бланка с набором букв русского алфавита, расположенных в случайном порядке. Среди этого фона скрыто 24 слова разной степени сложности. Задача: возможно быстрее отыскать их и подчеркнуть. Испытуемые: студенты факультета психологии Ленинградского университета и артисты балета Мариинского театра

Разряды

Эмпирические частоты

Группа студентов Группа артистов балета
0 пропусков 93 22
1 пропуск 27 20
2 пропуска 11 16
3 пропуска 15 4
4 пропуска 5 3
5 пропусков 3 11
6 пропусков 2 3
7 пропусков 0 3
8 пропусков 0 2
9 пропусков 0 1

 

ЗАДАЧА №3

 

В исследовании использовался опросник, направленный на выявление тенденции к вытеснению из памяти фактов, имен, намерений и способов действия, обусловленному личными, профессиональными или семейными комплексами. Опросник был создан на основе материалов книги З.Фрейда «Психопатология обыденной жизни». Выборка из студентов Педагогического института была обследована с помощью данного опросника, а также методики Менестера-Корзини для выявления интенсивности ощущения собственной недостаточности, или «комплекса неполноценности».

интенсивность ощущения собственной недостаточности

 

энергия вытеснения

высокая низкая
0 баллов 5 8
5 баллов 4 4
10 баллов 6 12
15 баллов 8 7
20 баллов 2 4
30 баллов 7 6
40 баллов 10 5
50 баллов 8 5
60 баллов 10 4

 

 


Дата добавления: 2018-06-27; просмотров: 371; Мы поможем в написании вашей работы!

Поделиться с друзьями:




Мы поможем в написании ваших работ!