Покажите что, при усилении эффекта мультиколлинеарности, дисперсия оценок параметров линейной регрессии модели бесконечно возрастает.



Для наглядности рассмотрим случай k=2. . Пусть для удобства мы пронормировали вектора : .

Тогда , где .

Тогда  и .

 

Если между переменными  и  существует некая линейная зависимость, т.е.  близко к 1, то, как следует из последнего выражения, дисперсии оценок параметров будут иметь большие значения.

При .

 

8. Вывести критерий Маллоуза.
Обозначения: индекс p - рассматривается модель с p параметрами, .  -  матрица данных ранга p, а аппроксимирующая подмодель регрессии в некоторой точке :

. Cp- статистика Мэлоуса. Если положить  для некоторой точки , то это математическое ожидание  может отличаться от  из-за возможного смещения модели с p параметрами (здесь  - истинные, неизвестные значения). Поэтому, если мы используем  в качестве оценки  для предсказания значения , где  - (неизвестный) отклик в точке , то среднеквадратичная ошибка предсказания равна

. Нужно отыскать такое подмножество, которое минимизирует (4.8) для заданных будущих значений , в качестве будущих точек  будем рассматривать имеющиеся  точек наблюдения. Он рассмотрел следующую величину (сумму квадратов)

, здесь - «смещение» сумм квадратов, равное .

Однако воспользоваться этой формулой сразу нельзя, так как нам не известны  и . Нам нужна несмещённая оценка  суммы квадратов , с помощью которой мы могли бы выбирать модели с малым значением . Мэлоус предложил использовать в качестве оценки для  статистику , где  - подходящая оценка для ,

Часто берут , где - полное число регрессоров. Можно доказать, что  является приблизительно несмещённой оценкой для .

Вариант3.

Основные этапы статистического исследования зависимостей.

Постановочный (единицы, переменные, цели, затраты)

Информационный (активный эксперимент, пассивный эксперимент)

Корреляционный анализ – позволяет ответить на вопросы, имеется ли вообще какая-либо связь между исследуемыми переменными, какова структура этих связей и как измерить их тесноту?

Определение класса допустимых решений

Анализ мультиколлинеарности факторов и отбор наиболее информативных из них

Вычисление оценок неизвестных параметров, входящих в исследуемое уравнение статистической связи.

Анализ точности полученных уравнений связи

 

Предположения которые используются в теореме Гаусса –Маркова.

Что означает термин «проверка структурных изменений»?

Пусть имеется две выборки    (  - наблюдений) и  (  - наблюдений). Нулевая гипотеза   против альтернативы       

Объединяя вместе две регрессии, получим:

В нульгипотезе система ограничений на параметры будет:

F- статистика: , где  – оценки вектора ошибок наблюдения с ограничением . Важным специальным случаем является ситуация когда одна из выборок мала для того чтобы оценить по ней все параметры, параметр n2 = n – n1 < m. Тогда . В этом случае соответствующая статистика имеет вид: .

Термин “полная модель”.

Полная модель – в которой число регрессоров совпадает с числом исходных регрессоров.


Дата добавления: 2018-08-06; просмотров: 199; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!