Проверка значимости коэффициентов регрессии
Напомним вид уравнения множественной линейной регрессии:
(1)
В программе «Регрессия» коэффициенты регрессии приведены в строке «Коэффициенты». Строка «Y-пересечение» - свободный член ; в других строка ниже: («Переменная Х1»); («Переменная Х2»). и т.д. Отметим, что на рис.2 приведен пример расчета парной регрессии , которая является частным случаем множественной.
Возможна ситуация, когда часть вычисленных коэффициентов регрессии не обладает необходимой степенью значимости. В этом случае значения рассматриваемых коэффициентов будут меньше величины их стандартной ошибки.
Поэтому наряду с проверкой адекватности полученного уравнения регрессии в целом (по значимости коэффициента детерминации ) необходимо выполнить проверку значимости каждого коэффициента регрессии.
Проверку значимости коэффициентов регрессии выполняют с помощью -критерия Стьюдента:
, (2)
где - значение рассматриваемого коэффициента регрессии; ;
- стандартная ошибка (погрешность) коэффициента ;
- расчетное значение коэффициента Стьюдента.
Формула для определения громоздкая и ее приводить не будем.
Коэффициент регрессии считается значимым при выполнении условия:
(3)
где - табличное значение коэффициента Стьюдента, выбираемое в зависимости от уровня значимости (обычно ) и степени свободы
|
|
. (4)
Здесь - количество факторов ; - число экспериментальных данных. В Excel для определения используется статистическая функция:
=СТЬДРАСПОБР( ; ).
В программе «Регрессия» значения приведены в столбце «Стандартная ошибка»; значения - в столбце « -статистика». Вместо условия (3) в данной программе вычисляются значения уровней значимости , соответствующие расчетным значениям . Они приведены в столбце «Р-значения». Для определения используется функция:
=СТЬЮДРАСП( ).
Если выполняется условие
, (5)
то коэффициент считается значимым. Здесь - заданный уровень значимости (обычно ).
Зная значения можно найти границы доверительных интервалов для коэффициентов регрессии:
;
(6)
.
В программе «Регрессия» приведены в столбце «Нижние 95%»; - «Верхние 95%».
Если незначимым окажется свободный член , то для пересчета уравнения регрессии без этого коэффициента в диалоговом окне «Регрессия» следует активировать флажок «Константы - ноль». В случае, если незначимым является коэффициент при факторном признаке , то следует исключить этот признак при задании уравнения регрессии.
|
|
Пример 1: получим уравнение множественной регрессии для зависимости функции от двух факторов, т.е. . Линейное уравнение имеет следующий вид: .
Воспользуемся данными из таблицы п. 2.1. В этой табл.: - уровень преступности ( ); - уровень образования ( ); - уровень безработицы ( ).
Результаты расчетов по программе «Регрессия» приведены на рис. 3.
Рис. 3. Лист Excel с результатами работы программы «Регрессия»
(множественная регрессия)
Видно, что в целом уравнение значимо, но коэффициент при переменной не значим и его следует исключить из анализа (т.е. при обращении к программе не указывать массив ). Получив уравнение увидим, что в целом качество этого нового уравнения регрессии повысится (получим большее значение «F» и, следовательно, меньшую величину «Значимость F»).
Пример 2: по данным таблицы получить уравнение . Убедится, что не значим коэффициент . Исключить его, т.е. получить уравнение вида: . Выполнить самостоятельно.
Номер предприятия
Мы поможем в написании ваших работ! |