Выборочные условные средние квадратические отклонения



; ;

; .

Выборочные частные коэффициенты регрессии

; .

Выборочное уравнение регрессии

.

В данном случае

или

.

Общий вывод

Результаты выполненного корреляционного анализа показывают, что признак Z имеет статистически значимую умеренную связь как с двумерным массивом признаков X, Y, так и с каждым из этих признаков в отдельности, что дает основание для перехода ко второму этапу статистического исследования - построению регрессионной модели, т.е. выявлению той конкретной математической зависимости переменной Z от переменных X, Y, которой наилучшим, в определенном смысле этого слова, образом отвечают имеющиеся статистические данные.

II. Регрессионный анализ

Постановка задачи

Требуется по указанным выше статистическим данным n=14 стран произвести регрессионный анализ зависимости уровня смертности от средней продолжительность жизни женщин и уровня рождаемости.

Трехмерная линейная модель регрессии

,

где

x, y, z - соответственно значения предикторов X, Y и критериальной переменной Z;

β0, β1, β2 – неизвестные параметры модели;

ε – остаточная компонента (возмущение), численно характеризующей случайность в изменении значения переменной Y.

Установление оценок параметров исходной модели регрессионного анализа
с помощью метода наименьших квадратов

Статистической мерой остаточной компоненты ε в методе наименьших квадратов служит сумма квадратов отклонений действительных (экспериментальных) значений критериальной переменной от соответствующих теоретических (расчетных) значений. Выбираются такие значения параметров модели, при которых данная сумма квадратов будет наименьшей.

Вектор  - несмещенная МНК-оценка параметров  - находится по формуле: .

В рассматриваемом случае матрицы , ,  имеют вид:

Определение вектора  осуществляется следующим образом.

1. Находится произведение матриц , :

2. Вычисляется произведение матриц :

3. Определяется матрица, обратная к матрице :

.

4. Находится вектор  МНК-оценок параметров  модели:

.

Итак,

.

Следовательно, выборочное уравнение линейной регрессии представимо в виде

.

Анализ качества модели регрессии

Необходимо, установить, соответствует ли эмпирическим данным построенная математическая модель:

,

а также определить, достаточно ли включенных в уравнение объясняющих переменных (предикторов) для описания зависимой (критериальной) переменной.

Проверка значимости уравнения множественной линейной регрессии

(при уровне значимости применяемого статистического критерия α=0,05)

Основная гипотеза: «Уравнение регрессии не значимое»:

.

Для определения значения статистики критерия Фишера:

► вычисляется вектор

,

► находится сумма квадратов расчетных средних значений признака Z:

.

► вычисляется вектор ошибок наблюдений (остатков):

.

► определяется остаточная сумма квадратов отклонений фактических значений признака Z от соответствующих расчетных средних значений, найденных на основе уравнения регрессии Z на (X, Y) - квадрат длины вектора ошибок наблюдений, обусловленных воздействием случайных факторов:

.

Получаем

.

Граничное (критическое) значение  определяется согласно уравнению:

,

принимающему в данном случае следующий вид:

.

Используя статистическую таблицу 4 (Распределение Фишера – Снедекора) находим

.

Условие отвержения основной гипотезы:  выполняется, следовательно, при уровне  уравнение регрессии значимое, т.е.можно заключить, что с вероятностью, равной 0,95, хотя бы один из коэффициентов β 1, β 2 существенно отличается от нуля.


Дата добавления: 2023-01-08; просмотров: 36; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!