Нелинейные регрессионные модели.
ОДНОФАКТОРНЫЕ РЕГРЕССИОННЫЕ МОДЕЛИ
И МЕТОД ИХ ПОСТРОЕНИЯ
Общий вид однофакторной регрессионной модели
Простейшие регрессионные модели отражают взаимосвязь показателя только с одним фактором. В общем случае однофакторную регрессионную модель можно представить в виде
, (1.1.1)
где
значение ого наблюдения моделируемого показателя;
значение фактора в ом наблюдении;
вектор неизвестных параметров, которые оцениваются по статистическим данным;
функция определяющая структуру регрессионной модели (линейную, степенную и т.п.);
ненаблюдаемая случайная величина, представляющая собой ту часть вариации показателя , которая не объясняется соответствующими изменениями фактора .
Чем ниже уровень возможных значений случайной величины , тем точнее модель отражает взаимодействие фактора х с показателем y. Т.е. параметры модели должны подбираться таким образом, чтобы минимизировать сумму квадратов отклонений (случайных составляющих )
. (1.1.2)
В общем случае поиск оптимальных параметров сводится к решению нелинейной экстремальной задачи. Обычно рассматривают линейный случай
, (1.1.3)
который значительно упрощает решение этой задачи.
|
|
Метод наименьших квадратов
Рассмотрим применение метода наименьших квадратов к случаю построения линейной регрессии (1.1.3). Для этого случая (1.1.2) перепишется в виде
. (1.2.1)
Применяя дифференциальное исчисление для минимизации (1.2.1) и дифференцируя по и , получаем систему линейных уравнений
,
. (1.2.2)
Разделив левую и правую части этой системы на число наблюдений N и произведя замену:
; ; ; ,
перепишем систему (1.2.2) в виде:
,
. (1.2.3)
Решая линейную систему (1.2.3) с помощью замены
получаем оценки коэффициентов однофакторной регрессионной модели в виде:
; . (1.2.4)
Рассчитанные таким образом коэффициенты регрессии , принято называть оценками МНК (метода наименьших квадратов).
|
|
Оценка качества уравнения регрессии.
Прежде, чем построенное уравнение регрессии использовать в аналитических целях, оценивается его качество с помощью системы показателей: коэффициента корреляции, дисперсионного отношения Фишера, критерия Стьюдента.
Коэффициент корреляции показывает тесноту линейной связи между моделируемым показателем и фактором и рассчитывается по формуле
, (1.3.1)
где
; .
Значение коэффициента корреляции заключены между -1 и 1. При =1 между показателем и фактором существует функциональная зависимость, при =0 между показателем и фактором нет линейной связи, при имеет место корреляционная связь.
Квадрат коэффициента корреляции, умноженный на 100 ( ), называют коэффициентом детерминации. Он показывает, насколько процентов вариация зависимой переменной y объясняется соответствующими изменениями независимой переменной x.
С помощью F-критерия (дисперсионного отношения Фишера) устанавливается адекватность регрессионной модели. Его расчет осуществляется по формуле
, (1.3.2)
где
n – число элементов выборочной совокупности;
m – число факторов.
|
|
В числители критерия (1.3.2) стоит сумма квадратов отклонений, обусловленная регрессией («объясненная» или «факторная»), деленная на число степеней свободы m, а в знаменателе – остаточная сумма квадратов отклонений, деленная на (n - m-1) (остаточная дисперсия).
Если , то построенная модель считается адекватной. - это максимально возможное значение дисперсионного отношения Фишера при данных степенях свободы и уровне значимости . Обычно принимается равным 0,05 или 0,01 и представляет собой вероятность отвергнуть правильную гипотезу при условии того, что она верна. Фактически, с помощью F-критерия проверяется - гипотеза о том, что =0.
Статистическая значимость каждого коэффициента регрессии в отдельности устанавливается с помощью t-критерия Стьюдента, рассчитываемого по формулам
; . (1.3.3)
Стандартные ошибки параметров линейной регрессии определяются по формулам
;
(1.3.4)
.
Кроме критерия Стьюдента, стандартные ошибки используются при расчете предельных ошибок
; , (1.3.5)
которые, в свою очередь, применяются для определения доверительных интервалов.
|
|
; . (1.3.6)
Если границы доверительного интервала содержат 0, т.е. нижняя граница отрицательна, а верхняя – положительна, то оцениваемый параметр считается незначимым.
Нелинейные регрессионные модели.
В случае, когда линейная модель неадекватна, строятся нелинейные регрессионные модели. Нелинейные модели принято делить на два класса: регрессии нелинейные относительно объясняющей переменной, но линейные по оцениваемым параметрам и регрессии, нелинейные по оцениваемым параметрам.
Нелинейные по объясняющей переменной:
· парабола ;
· полином третьей степени ;
· равносторонняя гипербола .
Нелинейные по оцениваемым параметрам:
· показательная ;
· степенная ;
· экспоненциальная .
Коэффициенты моделей первого класса рассчитываются с помощью метода наименьших квадратов. Построение моделей второго класса требует предварительного их приведения к линейному виду путем логарифмирования.
;
;
.
После построения с помощью метода наименьших квадратов преобразованных моделей коэффициенты исходных моделей в случае необходимости получаются путем потенцирования.
Теснота связи между фактором и показателем в нелинейных моделях измеряется с помощью индекса корреляции
, (1.4.1)
границы изменения которого 0 и 1. Чем ближе значение индекса корреляции к 1, тем теснее связь.
Адекватность нелинейных моделей, как и в линейном случае, определяется с помощью дисперсионного отношения Фишера (F-критерия).
Дата добавления: 2018-10-26; просмотров: 716; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!