Лабораторнаяработа № 1. Описательная статистика



Министерство образования и науки Российской Федерации

Байкальский государственный университет

 

 

ПРАКТИКУМ ПО ЭКОНОМЕТРИКЕ

В MSEXCELДЛЯ БАКАЛАВРОВ

 

Иркутск

Издательство БГУ

2016

УДК 519.862.6(075.8)

ББК 22.1я7

П12

 

Печатается по решению редакционно-издательского совета

Байкальского государственного университета

 

 

Составители: к.ф.-м.н., доцент Р.З. Абдуллин;к.ф.-м.н., доцент В.Р. Абдуллин

Кафедра математики и эконометрики

 

Рецензенты:к.ф.-м.н., доцент О.В. Леонова

к.т.н., доцент М.П. Базилевский

 

 

П12. Практикум по эконометрике в MSExcelдля бакалавров / сост. Р.З. Абдуллин, В.Р. Абдуллин. – Иркутск: Изд-во БГУ, 2016,137с.

 

 

Практикум содержит указания по выполнению лабораторных (расчетно-графических) работ по описательной статистике, корреляционному и дисперсионному анализу, построению уравнений регрессии, по выделению тенденции временного ряда с использованием надстройки «Анализ данных» MSExсel. Практикум содержит десять лабораторных работ, каждая из которых сопровождается: краткими теоретическими сведениями; разобранным примером выполнения работы и контрольными вопросами по теме работы. Практикум составлен на основании федеральных государственных образовательных стандартов высшего профессионального образования направлений бакалавриата38.03.01 Экономика, 38.03.02 Менеджмент, 38.03.03 Управление персоналом, 38.03.06 Торговое дело.

Для студентов очной и заочной форм обучения.

 

ББК 519.862.6(075.8)

© Издательство БГУ, 2016



СОДЕРЖАНИЕ

 

Предисловие. 4

Лабораторная работа № 1. Описательная статистика. 6

Лабораторная работа № 2. Корреляционный анализ. 24

Лабораторная работа № 3. Однофакторный дисперсионный анализ. 35

Лабораторная работа № 4. Парная линейная регрессия. 42

Лабораторная работа № 5. Нелинейная парная регрессия. 55

Лабораторная работа № 6. Множественная регрессия. 66

Лабораторная работа № 7. Анализ мультиколлинеарности и авторегрессии в модели множественной регрессии. 79

Лабораторная работа № 8. Линейные регрессионные модели переменной структуры, фиктивные переменные. 86

Лабораторная работа № 9. Выделение тенденции временного ряда: скользящая средняя; экспоненциальное сглаживание. 95

Лабораторная работа № 10. Аналитическое выравнивание. 106

временного ряда. 106

Литература. 114

Приложение: данные для выполнения лабораторных работ. 115

Данные для лабораторной работы № 1. 115

Данные для лабораторной работы № 2. 118

Данные для лабораторной работы № 3. 122

Данные для лабораторной работы № 4. 126

Данные для лабораторной работы № 5. 127

Данные для лабораторной работы № 6. 129

Данные для лабораторной работы № 7. 130

Данные для лабораторной работы № 8. 130

Данные для лабораторных работ № 9 и 10. 133

 


Предисловие

Любая область экономической деятельности связана с необходимостью количественного описания, анализа и прогнозирования экономических явлений и их взаимосвязей на основе реальных данных. Это требует применения современных методов и инструментов обработки социально-экономических информации, знания достижений экономической мысли и понимания современного научного языка. Большинство современных методов основывается на эконометрических моделях, концепциях и приемах; моделях временных рядов. Без знания основ эконометрики и анализа временных рядов научиться использовать их невозможно. Изучение современной экономической литературы также предполагает хорошую подготовку в области математической статистики и эконометрики.

Практикум предназначен студентам очной и заочной форм обучения и ориентирован на освоение начального курса эконометрики и получения навыков статистического анализа и построения эконометрических моделей с использованием пакета прикладных программ.

В настоящее время существует большое число статистических и эконометрических пакетов программ (STATISTICA, STATGRAPHICS, SPSS, GAUSS, Mesosaur, EconometricViews и другие). Выбор «Пакета анализа» MSExcel обусловлен его широким распространением, доступностью, изучениемMSExcel в курсе «Информатика», а также тем, что он обладает достаточным набором средств статистического анализа и математических операций для решения задач, входящих в начальный курс эконометрики.

Практикум состоит из трех частей. Первая часть, включающая три лабораторные работы, посвящена описательной статистике, статистической оценке параметров, проверке статистических гипотез, парной и множественной корреляции и однофакторному дисперсионному анализу.Она является необходимой базой при построении эконометрических моделей.

Вторая часть, из пяти работ, связана с построением моделей парной линейной и нелинейной регрессии, линейной множественной регрессии, верификацией моделей и оценкой качества моделей, построением точечных и интервальных прогнозов, анализом мультиколлинеарности, исследованием автокорреляции, использованием фиктивных переменных в эконометрических моделях.

Третья часть, из двух работ, посвящена выделению тенденции временного ряда и его аналитическому выравниванию, а также выявлению сезонных колебаний.

Все лабораторные работы содержат: краткие теоретические сведения; содержание и этапы выполнения работы; примеры решения типовых задач в MSExcel с необходимыми пояснениями порядка действий и диалоговых окон; контрольные вопросы по теме работы и разнообразные данные для исследования, охватывающие широкий спектр направлений применения эконометрики. Объединение этих частей дает студентам возможность более глубокого освоения теоретического материала и приобретения практических навыков использования эконометрических методов в анализе социально-экономической информации. В пособии используется двойная нумерация рисунков и формул, первоечисло указывает номер лабораторной работы, второе – порядковый номер рисунка или формулы в лабораторной работе.

Практикум полезен также и преподавателям при организации и проведении практических занятий по базовому курсу эконометрики с использованием надстройки «Анализ данных» MSExcel.


 

Лабораторнаяработа № 1. Описательная статистика

Цель работы.Оценка свойств генеральной совокупности по эмпирическим (наблюдаемым)данным (выборке) путем построения эмпирического распределения, нахождения числовых характеристик выборки, нахождения точечных и интервальных оценок параметров нормального распределения, проверки гипотезы о нормальном распределении генеральной совокупности.

Краткие сведения.

Генеральная совокупность – все мыслимое множество объектов на которых изучается некоторый признак(и). В математической статистике генеральная совокупность – это совокупность всех мыслимых значений изучаемого признака, которые могли быть получены при данном комплексе условий. Генеральная совокупность рассматривается как случайная величинаX с неизвестным законом распределения.

Выборка(выборочная совокупность) – часть объектов генеральной совокупности, на которой произведены измерения изучаемого признака. Совокупность  измеренных на выборке значенийизучаемого признака также называют выборкой. Количество nпроизведенных измерений (наблюдений) признака,называется объемом выборки.

Сущность выборочного метода состоит в оценке по выборке  свойств генеральной совокупности (свойств распределения случайной величины X).

Выборочные данные, упорядоченные по возрастанию или убыванию, называются вариационным рядом. Различные значения исследуемого признака в выборке называются вариантами.

Упорядоченная по возрастанию или убыванию последовательность вариант с указанием частот  (или относительной частоты )их повторения в выборке называется точечным вариационным рядом. Точечный вариационный ряд представляется таблицей, в первой строке (столбце) которой приводятся упорядоченные по возрастанию варианты , в последующих строках (столбцах) соответствующие им частоты  и относительные частоты .Точечный вариационный ряд представляется в виде следующей таблицы

Таблица 1.1

Здесь kколичество различных вариант в выборке,  – накопленные частоты вариант .

Точечный вариационный ряд является статистическим аналогом ряда распределения дискретной случайной величины.

При большом количестве вариант или при непрерывном характере исследуемого признака от точечного вариационного ряда переходят к интервальному вариационному ряду –выборочным данным сгруппированным поk последовательным интервалам числовой оси. Количество интервалов kопределяется какнатуральное число . Длины hинтервалов группирования находятся как где наибольшее и наименьшее значения в выборке. Границы Ciинтервалов определяются как

Интервальный вариационный ряд – это упорядоченная последовательность интервалов  с указанием частоты  каждого интервала, равной количеству выборочных данных попавших в рассматриваемый интервал, . В интервальный вариационный ряд также включают середины интервалов, относительные частоты интервалов, накопленные частоты интервалов , относительные накопленные частоты интервалов . Интервальный вариационный ряд представляется следующей таблицей.

Таблица 1.2

Номер интервала
1
2 =
k mk=n 1

От интервального вариационного ряда можно перейти к точечному вариационному ряду поставив в соответствие серединам интервалов частоты соответствующих интервалов. Столбцы стретьего по шестой интервального вариационного ряда являются точечным вариационным рядом построенном по серединам интервалов, который представляется следующей таблицей

Таблица 1.3

Для графического представления вариационных рядов (эмпирического распределения) используются полигон частот или относительных частот, гистограмма частот или относительных частот, кумулятивная кривая.

Полигон частотстроится по точечному вариационному ряду (или точечному вариационному ряду, построенному по серединам интервалов) и представляет собой ломанную, отрезки которой последовательно соединяют точки .

Полигон относительных частот это ломанная, отрезки которой последовательно соединяют точки . Полигон относительных частот является статистической аппроксимацией многоугольника распределения дискретной случайной величины.

Гистограмма частот или относительных частот строится по интервальному вариационному ряду и представляет собой ступенчатую фигуру на плоскости, состоящую из прямоугольников основаниями которых служат интервалы , ,  , , а высоты равны частотам или относительным частотам этих интервалов.

Кумулятивная кривая (кумулята)– это кривая относительных накопленных частот (или накопленных частот), строится по точеному вариационному ряду (или интервальному вариационному ряду) и представляет собой плавную линию, проходящую через точки (или точки (C0, 0), (C1, m1/n), (C2, m2/n), , (Ck, mk/n)).

Вариационные ряды и их графические изображения представляют эмпирическое (выборочное) распределение исследуемого признака генеральной совокупности. Эмпирическое распределение задается и эмпирической функцией распределения  , которая для любого числа xопределяется как отношение количества nx выборочных данных меньших числа xк объему выборкиn.Эмпирическая функция распределения является статистическим аналогом функции распределения исследуемого признака генеральной совокупности(исследуемой случайной величины X). Эмпирическая функция распределения, построенная по точечному вариационному ряду по серединам интервалов, имеет вид

Числовые характеристики выборки.

Характеристики положения выборки(средние величины) определяют положение выборки на числовой оси одним числом, вокруг которого концентрируются выборочные данные. Наиболее распространенными характеристиками положения являются выборочнаясредняя , выборочная средняя геометрическая ,мода выборки , медиана выборки .

Выборочнаясредняя по исходной выборке определяется как , по точечному вариационному ряду как .

Выборочнаясредняягеометрическая по исходной выборке определяется как ,по точечному вариационному ряду как .

Модой выборки называется варианта с наибольшей частотой. Она определяется по точечному вариационному ряду. Для выборки, заданной интервальным вариационным рядом, мода выборки  определяется соотношением

,

где  – частота модального интервала, интервала с наибольшей частотой;  – нижняя граница модального интервала;h– длина модального интервала;  - частота интервала, предшествующего модальному;  - частота интервала, следующего за модальным.

Медиана выборки называетсязначение признака, приходящее на середину вариационного ряда (выборочных значений, упорядоченных по возрастанию), т.е. медиана выборки делит выборку на две части равные по частоте. Для выборки, заданной интервальным вариационным рядом, медиана выборки  определяется соотношением

,

где  – частота медианного интервала, первого интервала для которого накопленная частота превышает половину объема выборки (n/2);  – нижняя граница медианного интервала;h– длина медианного интервала;  - накопленная частота интервала, предшествующего медианному.

Характеристики вариации (рассеяния) выборки описывают изменчивость значений изучаемого признака. Наиболее распространенными характеристиками вариации являются:

вариационный размах ;

выборочная дисперсия,равная среднему арифметическому квадратов отклонений выборочных значений от выборочной средней, определяется по исходной выборке как , а по точечному вариационному ряду как ;

выборочное среднее квадратическое отклонение(стандартное отклонение) ;

исправленная выборочная дисперсия ;

исправленное выборочное среднее квадратическое отклонение ;

коэффициент вариации

Выборочная средняя и выборочная дисперсия обладают такими же свойствами, что и математическое ожидание, и дисперсия случайной величины.

Характеристики формы распределения выборки:

выборочный коэффициент асимметрии является мерой отклонения распределения выборки от симметричного, при  распределение выборки (полигон частот, гистограмма частот) симметрично относительно прямой , при  ( )распределение выборки имеет более пологую правую (левую) часть;

выборочный эксцесс является показателем «крутости» распределения выборки по сравнению с нормальным распределением.

Статистическое оценивание параметров распределениягенеральной совокупности.Различают:

точечные оценки– оценки в виде одного числа , в окрестности которого находится истинное значение θоцениваемого параметра,

интервальные оценки, представляющие числовой интервал ( , ) с заданной вероятностью ,близкой к единице, накрывающие истинное значение оцениваемого параметра. Интервал ( , ) называется доверительным, а вероятность называется доверительной вероятностью или надежностью оценки.

Точечные оценки  и границы доверительного интерваланаходятся как функции выборки  и являются случайными величинами.

Свойства точечных оценок.

Оценка  параметра θ называется несмещенной, если ее математическое ожидание равно оцениваемому параметру θ, т.е. M = θ. В противном случае оценка называется смещенной.Несмещенность оценки гарантирует отсутствие систематических ошибок при оценивании.

Оценка  параметра θ называется состоятельной, если она сходится по вероятности к оцениваемому параметру.Состоятельность оценки обеспечивает при достаточно больших объемах выборки, с вероятностью близкой к единице, приближенное равенство θ≈ .

Несмещенная оценка  параметра θ называется эффективной, если она имеет наименьшую дисперсию среди всех несмещенных оценок параметра θ, построенных по выборкам одного и того же объема n.

Выборочная средняя является несмещенной, состоятельной оценкой математического ожидания генеральной совокупности.

Выборочная дисперсия  является смещенной и состоятельной оценкой дисперсии генеральной совокупности. Исправленная выборочная дисперсия  является несмещенной и состоятельной оценкой дисперсии генеральной совокупности. Выборочная дисперсия  и исправленная выборочная дисперсия  являются эффективными оценками дисперсии генеральной совокупности лишь асимптотически (т.е. только при неограниченном возрастании объема выборки).

Интервальные оценки заданной надежности  математического ожидания (a) и дисперсии (σ2) генеральной совокупности, распределенной по нормальному закону, определяются неравенствами

;

Здесь  – квантиль уровня  распределения Стьюдента с числом степеней свободы равным n-1;  и  квантили соответственно уровней  и  распределения  (распределения хи-квадрат) с числом степеней свободы равным n-1.

Проверка гипотезы о нормальном распределении генеральной совокупности на уровне значимости α=0,05 по критерию согласия - Пирсона.

Проверяется нулевая гипотеза H0: о нормальном распределении генеральной совокупности (случайно величины X).Параметры a(математическое ожидание) и σ(среднее квадратическое отклонение) неизвестны. За их значения принимаются их несмещенные и состоятельные оценки: выборочная средняя  и исправленное выборочное среднее квадратическое отклонение Таким образом, проверяется нулевая гипотеза H0: . Для проверки этой гипотезы используется статистика критерия

,

которая является мерой расхождения теоретического распределения  и эмпирического распределения представленного точечным или интервальным вариационным рядом. В этом критерии k– количество интервалов в интервальном вариационном ряду; ni–частоты интервалов(Ci-1, Ci) (наблюдаемые частоты); n – объем выборки;pi – теоретические вероятности попадания случайной величины Xв интервал (Ci-1, Ci), подсчитанные по предполагаемому нормальному распределению; npi– теоретические частоты интервалов. Для эмпирического распределения, представленного интервальным вариационным рядом, теоретические вероятности вычисляются как

или

,

где функция распределения нормально распределенной случайной величины с математическим ожиданием равным  и средне квадратическим отклонением равнымs,  – функция Лапласа.

Статистика при  имеет распределение  с числом степеней свободы равным k-r-1, где r – число параметров теоретического распределения (для нормального распределения r=2).

Если вычисленное по выборке значение критерия  больше критического значения , то нулевая гипотеза H0:  отвергается (гипотеза противоречит выборочным данным). Если вычисленное значение критерия , то нулевая гипотеза H0:  принимается на уровне значимости  (гипотеза о нормальном распределении генеральной совокупности с параметрами согласуется с выборочными данными). Критическое значение  это квантиль уровня 1-α распределения  с числом степеней свободы равным k-r-1.


Дата добавления: 2018-04-15; просмотров: 1458; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!