Нелинейные регрессионные модели.

ОДНОФАКТОРНЫЕ РЕГРЕССИОННЫЕ МОДЕЛИ

И МЕТОД ИХ ПОСТРОЕНИЯ

Общий вид однофакторной регрессионной модели

Простейшие регрессионные модели отражают взаимосвязь показателя только с одним фактором. В общем случае однофакторную регрессионную модель можно представить в виде

, (1.1.1)

где

значение ого наблюдения моделируемого показателя;

значение фактора в ом наблюдении;

вектор неизвестных параметров, которые оцениваются по статистическим данным;

функция определяющая структуру регрессионной модели (линейную, степенную и т.п.);

ненаблюдаемая случайная величина, представляющая собой ту часть вариации показателя , которая не объясняется соответствующими изменениями фактора .

Чем ниже уровень возможных значений случайной величины , тем точнее модель отражает взаимодействие фактора х с показателем y. Т.е. параметры модели должны подбираться таким образом, чтобы минимизировать сумму квадратов отклонений (случайных составляющих )

. (1.1.2)

В общем случае поиск оптимальных параметров сводится к решению нелинейной экстремальной задачи. Обычно рассматривают линейный случай

, (1.1.3)

который значительно упрощает решение этой задачи.

Метод наименьших квадратов

Рассмотрим применение метода наименьших квадратов к случаю построения линейной регрессии (1.1.3). Для этого случая (1.1.2) перепишется в виде

. (1.2.1)

Применяя дифференциальное исчисление для минимизации (1.2.1) и дифференцируя по и , получаем систему линейных уравнений

. (1.2.2)

Разделив левую и правую части этой системы на число наблюдений N и произведя замену:

; ; ; ,

перепишем систему (1.2.2) в виде:

. (1.2.3)

Решая линейную систему (1.2.3) с помощью замены

получаем оценки коэффициентов однофакторной регрессионной модели в виде:

; . (1.2.4)

Рассчитанные таким образом коэффициенты регрессии , принято называть оценками МНК (метода наименьших квадратов).

Оценка качества уравнения регрессии.

Прежде, чем построенное уравнение регрессии использовать в аналитических целях, оценивается его качество с помощью системы показателей: коэффициента корреляции, дисперсионного отношения Фишера, критерия Стьюдента.

Коэффициент корреляции показывает тесноту линейной связи между моделируемым показателем и фактором и рассчитывается по формуле

, (1.3.1)

где

; .

Значение коэффициента корреляции заключены между -1 и 1. При =1 между показателем и фактором существует функциональная зависимость, при =0 между показателем и фактором нет линейной связи, при имеет место корреляционная связь.

Квадрат коэффициента корреляции, умноженный на 100 ( ), называют коэффициентом детерминации. Он показывает, насколько процентов вариация зависимой переменной y объясняется соответствующими изменениями независимой переменной x.

С помощью F-критерия (дисперсионного отношения Фишера) устанавливается адекватность регрессионной модели. Его расчет осуществляется по формуле

, (1.3.2)

где

n – число элементов выборочной совокупности;

m – число факторов.

В числители критерия (1.3.2) стоит сумма квадратов отклонений, обусловленная регрессией («объясненная» или «факторная»), деленная на число степеней свободы m, а в знаменателе – остаточная сумма квадратов отклонений, деленная на (n - m-1) (остаточная дисперсия).

Если , то построенная модель считается адекватной. - это максимально возможное значение дисперсионного отношения Фишера при данных степенях свободы и уровне значимости . Обычно принимается равным 0,05 или 0,01 и представляет собой вероятность отвергнуть правильную гипотезу при условии того, что она верна. Фактически, с помощью F-критерия проверяется - гипотеза о том, что =0.

Статистическая значимость каждого коэффициента регрессии в отдельности устанавливается с помощью t-критерия Стьюдента, рассчитываемого по формулам

; . (1.3.3)

Стандартные ошибки параметров линейной регрессии определяются по формулам

;

(1.3.4)

Кроме критерия Стьюдента, стандартные ошибки используются при расчете предельных ошибок

; , (1.3.5)

которые, в свою очередь, применяются для определения доверительных интервалов.

; . (1.3.6)

Если границы доверительного интервала содержат 0, т.е. нижняя граница отрицательна, а верхняя – положительна, то оцениваемый параметр считается незначимым.

Нелинейные регрессионные модели.

В случае, когда линейная модель неадекватна, строятся нелинейные регрессионные модели. Нелинейные модели принято делить на два класса: регрессии нелинейные относительно объясняющей переменной, но линейные по оцениваемым параметрам и регрессии, нелинейные по оцениваемым параметрам.

Нелинейные по объясняющей переменной:

· парабола ;

· полином третьей степени ;

· равносторонняя гипербола .

Нелинейные по оцениваемым параметрам:

· показательная ;

· степенная ;

· экспоненциальная .

Коэффициенты моделей первого класса рассчитываются с помощью метода наименьших квадратов. Построение моделей второго класса требует предварительного их приведения к линейному виду путем логарифмирования.

;

После построения с помощью метода наименьших квадратов преобразованных моделей коэффициенты исходных моделей в случае необходимости получаются путем потенцирования.

Теснота связи между фактором и показателем в нелинейных моделях измеряется с помощью индекса корреляции

, (1.4.1)

границы изменения которого 0 и 1. Чем ближе значение индекса корреляции к 1, тем теснее связь.

Адекватность нелинейных моделей, как и в линейном случае, определяется с помощью дисперсионного отношения Фишера (F-критерия).

Дата добавления: 2018-10-26; просмотров: 716; Мы поможем в написании вашей работы!

Поделиться с друзьями:

12 Следующая ⇒

Мы поможем в написании ваших работ!