Данные наблюдений для эконометрического моделирования
Для построения эконометрической модели используется выборка значений зависимой переменной Y и выборки по каждой из объясняющих переменных X1, X2, ... , Xp . Число наблюдений n должно примерно на порядок и больше превышать число объясняющих переменных р и быть достаточно велико. Например, р=2 - две объясняющие переменные и n=22 – число наблюдений.
Увеличению n препятствует либо ограниченный объем данных наблюдения, либо неоднородный состав этих данных и необходимость разбивать их на однородные массивы (кризисы в экономике, резкие изменение конъюнктуры рынка и т.п.).
Другая проблема - необходимость делать предположение о том, что условное распределение СВ Y одинаково при различных наборах значений объясняющих переменных Х.
Исходные данные делят на два типа: пространственные и временные. Под пространственными данными понимаются результаты наблюдений по множеству объектов за одинаковый интервал или на один момент времени, например, выборка рентабельности по n средним и большим предприятиям города за 2004 г. Важно то, что порядок изучения предприятий и расположения их в выборке здесь не имеет значения.
Формально пространственной выборкой называют серию из n независимых наблюдений (р+1)-мерной СВ (X1, X2, ... , Xp, Y). При этом различные СВ Yi обычно принимаются независимыми и отсюда следует некоррелированность возмущений:
r(ei, ej) = 0 при i¹j. | (1.6) |
|
|
Это условие упрощает модель и ее анализ. Однако практически доказать независимость случайных величин часто оказывается невозможным, поскольку есть доводы как за, так и против этой гипотезы. Например, довод против независимости: все наблюдаемые предприятия находятся в однородной рыночной среде (курсы валют, законодательная база, цены на мировом рынке и пр.).
Таким образом, эконометрическая модель на основе пространственных наблюденных данных (xi, yj) имеет вид:
yi=f(xi) + ei, i=1, 2, ... , n. | (1.7) |
Ошибки регрессии удовлетворяют условиям:
- математическое ожидание ошибок наблюдений М(ei,)=0; | (1.8) |
- коэффициент корреляции между ошибками наблюдений r(ei, ej)=0; | (1.9) |
- дисперсия ошибок наблюдений D(ei)=si2. | (1.10) |
Дисперсия ошибок (1.10) может быть двух типов:
а) одинаковой для всех наблюдений: si2 = sj2 при всех i и j. Постоянство дисперсий ошибок называется гомоскедастичностью, это свойство облегчает проведение анализа модели;
б) неодинаковой для различных наблюдений: si2 ¹ sj2 . Это свойство дисперсий называется гетероскедастичностью. Оно затрудняет статистический анализ и может потребовать ее устранения.
Временной выборкой (временным рядом) называется такая выборка, в которой нельзя без потери смысла произвольно менять порядок следования наблюденных значений: каждое значение связано с определенным моментом времени. Обычно предполагается, что в разные моменты времени тип распределения наблюдаемой СВ остается одним и тем же, хотя параметры распределения меняются во времени. Очень часто при этом близко расположенные по времени значения СВ не являются независимыми. Отсюда следует коррелированность ошибок между собой. Это значительно усложняет анализ модели.
|
|
Линейная регрессионная модель
В практической работе теоретическое уравнение регрессии Мх(Y) находят приблизительно путем сглаживания (аппроксимации) наблюденных выборочных значений Х и Y.
Для этого сначала определяется тип функции, наиболее близкий к Мх(Y) - процесс спецификации модели. Практически спецификация делается путем объединения разнородной информации: теоретических предположений о характере зависимости, графического представления зависимостей в виде точек и/или соединяющих их ломаных линий, привлечения явлений и моделей аналогов на основе знания экспертов.
Наиболее эффективен графический способ. Анализируя на плоскости, если это возможно, поле наблюденных точек, определяем тренд, который и выступает в роли регрессии Мх(Y). Чаще всего для сглаживания используется линейная функция.
|
|
Достоинства линейной функции:
- простота получения и содержательной интерпретации,
- естественность в том смысле, что из предположения о нормальности распределения СВ (Х, Y) автоматически вытекает линейность уравнения регрессии; такое предположение вполне естественно;
- меньший риск получить большую ошибку прогноза: ожидаемое значение ошибки прогноза, т.е. математического ожидания квадрата отклонения наблюдаемых значений от сглаженных (теоретических) М(Yнабл - Yтеор)2 оказывается меньше, если уравнение регрессии выбрано линейным.
Линейные регрессионные модели, удовлетворяющие условиям (1.8), (1.9) и (1.10) c постоянной ошибкой регрессии (гомоскедастичность), называются классическими моделями (КЛРМ).
Дата добавления: 2018-04-04; просмотров: 133; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!