Реализация типовых задач на компьютере



 

Получить уравнение множественной регрессии на компьютере можно с помощью ППП Excel (функции ЛИНЕЙН и инструмента РЕГРЕССИЯ), ППП MS Excel (описательная статистика) и  Statgraphics.

1.8.1. Решение задач с помощью ППП Excel (функции ЛИНЕЙН)

 

Учитывая, что при построении уравнения множественной регрессии следует исключать дублирующие факторы, рассчитываются парные коэффициенты корреляции переменных, по величине которых определяют их коллинеарность.

Матрицу парных коэффициентов корреляции можно рассчитать, используя инструмент анализа данных, Корреляция. Для этого:

1. В главном меню последовательно выберите пункты Сервис/Анализ данных/Корреляция. Щелкните по кнопке ОК;

2. Заполните диалоговое окно ввода данных и параметров вывода (рис. 1.1):

Входной интервал – диапазон, содержащий анализируемые данные, это может быть одна или несколько строк столбцов;

Группирование – по столбцам (или по строкам);

Метки – флажок, который указывает, содержит ли первая строка названия столбцов или нет;

Выходной интервал – достаточно указать левую верхнюю ячейку будущего диапазона;

Щелкните по кнопке ОК.

 

3. Результаты вычислений - матрица парных коэффициентов корреляции – представлены на рис. 1.2.

         

Рис.1.1 Диалоговое окно вводов параметров инструмента Корреляция


 

Рис. 1.2. Матрица коэффициентов парной корреляции

 

Встроенная статистическая функция ЛИНЕЙН определяет параметры линейной регрессии  Порядок вычисления следующий:

1) введите исходные данные или откройте существующий файл, содержащий анализируемые данные;

2) выделите область пустых ячеек 5 х (P+1) (5 строк, (P+1) столбца) для вывода результатов регрессионной статистики или область 1 х (P+1) – для получения только оценок коэффициентов регрессии;

3) активизируйте мастер функций любым из способов:

a) в главном меню выберите Вставка /Функция;

 

Рис. 1. 3. Диалоговое окно «Мастер функций»

 

b) на панели инструментов Стандартная щелкните по кнопке Вставка функции;

4) в окне Категория (рис.1.3) выберите Статистические, в окне Функция – ЛИНЕЙН. Щелкните по кнопке ОК;

5)

 

заполните аргументы функции (рис.1.4) по исходным данным (рис. 1.2):

 

Pис. 1.4. Диалоговое окно ввода аргументов функции ЛИНЕЙН

Известные значения у – диапазон, содержащий данные результативного признака;

Известные значения х - диапазон, содержащий данные факторов независимого признака:

Константа – логическое значение, которое указывает на наличие или отсутствие свободного члена в уравнении. Если Константа =1 (Истина), то свободный член рассчитывается , если Константа = 0 , то свободный член равен 0.;

Статистика - логическое значение, которое указывает, выводить дополнительную информацию по регрессионному анализу или нет. Если Статистика =1 (Истина), то дополнительная информация выводится, если Статистика = 0, то выводятся только оценки параметров уравнения.

6) нажмите на комбинацию клавиш <Ctrl> + <Shift> < Enter>;

7) данные регрессионного анализа будут выводиться в следующем порядке:

 

Значение коэффициента b р . . . Значение коэффициента b1 Значение коэффициента а
Стандартная ошибка коэффициента b p (m b p) . . . Стандартная ошибка коэффициента b1 (mb1) Стандартная ошибка коэффициента а (m a)
Коэффициент детерминации  R2 . . . Стандартная ошибка результата  (m )  
Критерий Фишера F-критерий . . . Остаточное число степеней свободы (df)  
Факторная сумма квадратов - SS факт. . . . Остаточная сумма квадратов -  SS ост.  

 

Для данных вышеприведенного примера результат вычисления множественной регрессии ЛИНЕЙНпредставлен на рис.1.5.


 


Рис. 1.5. Результат вычисления функции ЛИНЕЙН

 

Множественная линейная регрессия имеет вид:

 

.

 

Множественный коэффициент детерминации R2 = 0,644. Это говорит о том, что доля вариации результата у за счет анализируемых факторов х1 и х2 составляет 64,4 %. Доля вариации от неучтенных в анализе факторов - 35,6 %.

Расчетное значение критерия Фишера - F расч.= 7,242. Табличное значение критерия Фишера при df факт.= 2 и df ост. = 8 составляет - F табл. = 4,46. Следовательно, полученное уравнение множественной регрессии линейного вида статистически значимо с вероятностью ошибки 5%.

Для получения нелинейной регрессии необходимо выполнить преобразование исходных данных, исходя из формы модели. Например, для получения модели в виде полинома второго порядка:

 

 

факторы х1, х2, . . . хр следует возвести в квадрат и в диалоговом окне ввода аргументов функции ЛИНЕЙНпри заполнении параметра входной интервал Х следует указать все столбцы, содержащие значения факторных признаков. Результаты анализа (на основании исходных данных рис. 1. 2) представлены на рис.1.6.

 

Рис.1.6. Результат применения функции ЛИНЕЙН для получения нелинейной регрессии
в виде полинома второго порядка

 

По результатам вычислений составим уравнение множественной регрессии

 

.

 

Множественный коэффициент детерминации R2 = 0,95. Это говорит о том, что доля вариации результата у за счет анализируемых факторов х1 и х2  и их квадратов составляет 95 %. Доля вариации от неучтенных в анализе факторов снизилась до5,0 %.

Расчетное значение критерия Фишера - F расч.= 26,71. Табличное значение критерия Фишера при df факт.= 4 и df ост. = 6 составляет - F табл. = 4,59. Следовательно, полученное уравнение множественной регрессии линейного вида статистически значимо с вероятностью ошибки 5%.

 


Дата добавления: 2018-02-15; просмотров: 652; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!