Создайте таблицу, в которой столбцам будут соответствовать объекты исследования, а строкам – ответы экспертов



17.ВыберитеStatisticsàNonparametricsàComparingmultipledep. samplesàOK.

18.Выберите все переменные, соответствующие элементам исследования.

19.Summary. Будет выведена таблица вида

Здесь важен коэффициент конкордации (согласия). Он изменяется от 0 (связи между ранжированиями-строками нет) до 1 (связь полная). Границы значений: 0…0,3 – согласованности мнений нет; 0,3…0,7 - согласованность средняя, 0,7…1,0 – согласованность высокая.

20.Сделайте вывод о согласованности мнений экспертов.

21.Результат работы

21.1. Исходные данные по всем задачам.

21.2. Таблицы результатов анализа.

21.3. Выводы по каждой задаче.

Корреляционно-регрессионный анализ

Введите исходные данныев систему Statistica. Они находятсяв файле Excel. Это объем продаж в различных магазинах сети, затраты на рекламу на ТВ и на радио; затраты на рекламу в печати.

Исходные данные находятся в файле Excel. Объем продаж как результат рекламы на тв+радио и в газетах+жунралах.

1.Ввести данные в системуStatistica. Задать названия переменных. Сохранить файл.

2.Дополнительно. Определить, в чем суть статистики. По данным СМИ, уровень счастья в РФ составляет 82%. Однако всех студентов не опрашивали. Откуда тогда такие сведения?

Парная регрессия

3.Сформулируйте задачу: определить, какой будет объем продаж, если на телевизионную и радиорекламу потратим Х тыс. USD? Для этого требуется построить линейную (?) зависимость продаж от ТВ рекламы.

Y (объем продаж, результат, следствие, зависимая переменная) =

= B0+B1*X (затраты на рекламу, фактор, причина, независимая переменная).

Формула справедлива в диапазоне от минимального до максимального значения независимой переменной

B1 показывает, как увеличится Y при увеличении X на 1.

B0 – иногда (см. выше!) показывает Y при отсутствии Х.

Это статистика, поэтому результат будет в определенном диапазоне и с определенной достоверностью.

Местами временами дождь.

4.Startistics à Multiple regression (пока 1 независимая переменная, но может быть больше) à<выбор переменных Х, Y>à OK.

5.Summary. В столбце Bвидны параметры искомого уравнения. Найдите свободный член и коэффициент при затратах на ТВ рекламу. Запишите вид уравнения.

6.Постройте график.GraphsàScatterplotsà<ЗадайтеXиY>. Какая переменная откладывается по оси X, а какая – по Y?

7.Видны точки и линия регрессии(она по умолчанию изображается на графике. Проверьте, действительно ли онасоответствует приведенным значениям B0 и B1.

8.Опишите, как следует пользоваться полученной линией регрессии. По заданному значению затрат на ТВ рекламу определяется ожидаемый объем продаж.

9.Определяется значимость коэффициентов уравнения (их отличие от нуля). Если B1 равно нулю, то объем продаж одинаков при различных затратах на рекламу, то есть связи между рекламой и объемом продаж нет. SummaryàStderrofBравно 104. Для оценки отличия коэффициента от нуля берется его расстояние от нуля в сигмах = стандартных ошибках оценки. Видно, что отклонение составляет почти 3 сигма. Для 95% уверенности достаточно двух сигм (при малом количестве измерений – немного больше). Значит, значение B0 отлично от нуля.

10.Найдите значение p – вероятности того, что параметр B0 равен нулю. Можно ли отвергнуть эту гипотезу с уровнем достоверности 95%?

11.Сделайте такой же вывод по коэффициенту B1.

Далее определяется значимость всего уравнения в целом. Объясняет ли это уравнение значительную часть разброса измеренных значений? Для этого используется критерий Фишера. Нуль-гипотеза: уравнение ничего не объясняет.

12.Для иллюстрации рассуждений вберите MultpileregressionresultsàANOVA – дисперсионныйанализ.

13.Multiple regression results à Residuals/Assumptions/prediction à Perform Residual analysis à Quick à Summary.Будет выведена большая таблица.

14.В первом столбце содержатся данные, взятые из исходной таблицы. Во втором – точки, рассчитанные для каждого значения затрат на рекламу по полученному уравнению регрессии. В третьем – разница между ними, то есть расстояние от реальных точек до линии регрессии. Таким образом, в трех столбцах содержатся три набора данных. Если рассматривать их по отдельности, для них можно рассчитать сумму квадратов отклонений от среднего значения 9первый столбец результатов. Во втором столбце показано количество степеней свободы для расчета критерия Фишера. Далее видно отношение дисперсии рассчитанных значений (точек на линии регрессии) и остатков. Видно, что результат для объясненной части разброса (точек на линии) в 38 раз больше, чем для остатков. Это говорит о том, что линия регрессии взяла на себя большую часть разброса измеренных данных. Наконец, в правой части рассчитано значение p– вероятности того, что гипотеза о том, что уравнение ничего не объясняет. Она равна 0,000005.Сделайте вывод о том, можно ли отвергнуть эту гипотезу.

15.Определите, какую часть изменений объема продаж объясняет полученное уравнение регрессии. Этот показатель находится в шапке первой таблицы результатов. Этокоэффициент детерминации R2. Рекомендуется пользоваться уточненным показателем AdjustrdR2.

Если коэффициент детерминациименее 50%,
то уравнение не годится для прогноза.

16.Определите тесноту связи между объемом продаж и затратами на ТВ рекламу. Это – коэффициент корреляции (показатель R). Он представляет собой корень из коэффициента детерминации. Если знак корреляции положителен, рост затрат на рекламу приводит к росту продаж. Знак коэффициента корреляции совпадает со знаком коэффициента регрессии независимой переменной.

Если коэффициент корреляции по модулю меньше 0,3, считается, что связи нет. Если он больше 0,7, считается, что связь тесная.

17.Определите доверительный интервал значений объема продаж, определяемого по уравнению регрессии. В результатах регрессионного анализа найдите значение показателя Std Error of estimate – ошибка уравнения регрессии. = стандартная ошибка оценивания = корень из остаточной дисперсии. Для достоверности 95% ширина доверительного интервала будет равна ± 2 значения этого показателя, а для достоверности 99,7% - ± 3 значения.

18.Представьте результат анализа в форме:

В диапазонах величин затрат на рекламу от ___ до ___(значение объема продаж) будет равно ___ + ___ * (затраты на ТВ)±___ с достоверностью ___%.

19.Проведите подобный анализ для других форм регрессионного уравнения, выберите лучшее уравнение.

20.Самостоятельно проведите аналогичный анализ для зависимости объема продаж от печатной рекламы

Множественная регрессия

21.Построение матрицы парных коэффициентов корреляции для примера с объемами продаж. Statistics à Basic Statistics/Tables à Correlation Matrices àOK.

22.ПоставьтегалочкунаопцииDisplay p-levels and N’s.

23.НажмитеOne variable list à Select All à OK à Summary.

Появляется корреляционная матрица. В ней видны корреляции между всеми переменными. Корреляция переменной с самой собой (значения расположены на главной диагонали) равна единице.

24.Определите зависимую переменную, значения которой должно объяснять регрессионное уравнение.

25.Выберите независимые= объясняющие переменные.

25.1. Если коэффициент меньше 0,3, то связи между зависимой переменной и анализируемой независимой нет.

25.2. Если коэффициент больше 0,7, связь сильная.

25.3. Из независимых переменных с большим значением корреляции с зависимой выберите только те, большое значение для которых достоверно (pменьше 0,05. p – вероятность того, что гипотеза об отсутствии корреляции верна).

25.4. Проверьте, имеется ли корреляция между независимыми переменными.

25.5. Если она есть и достоверна (p<0,05), следует оставить только одну из данной пары. Выберите ту из двух, корреляция которой с зависимой переменной наибольшая).

26.Дальнейшие действия аналогичны действиям при построении парной регрессии, но выбирается несколько независимых переменных. Итоговое уравнение множественной регрессии имеет вид

                          Y=B0+B1X1+B2X2+…

 

 

27.Постройте уравнение множественной регрессии для реальных данных.

Поиск данных произведите на сайтах ФОМ, ВЦИОМ, Левада-центра, Росстат, ВТО и др.

Ссылки на некоторые источники данных можно найти в описании практической работы1.

28.Сформулируйте результаты каждого исследования:

 

 

28.1. Вид уравнения.

28.2. Значимость параметров уравнения.

28.3. Значимость уравнения в целом.

28.4. Какую часть изменений в объеме продаж объясняет уравнение.

28.5. Можно ли использовать уравнение для прогноза значения зависимой переменной по значениям независимой.

28.6. В каких диапазонах справедливы прогнозы.

28.7. Итог всего исследования в формате:

В пределах (затрат1) от _____ до _____

и (затрат2) от _____ до _____

(объем продаж)= ______

+______*(затраты1)

                       +______*(затраты2)

±______с достоверностью 95%.

Прогнозирование

1.Выберите три ряда данных по годам, не менее, чем за 15 лет (данные по годам исключают сезонность). Выбор следует производить на основе некоторой гипотезы об их взаимосвязи, например, из экономической теории следует, что инфляция и безработица связаны обратной связью, а развитие промышленности ведет к росту благосостояния. Возможные источники данных:

· Евростат

· Данные ООН

· Данные Росстата

· Опросы общественного мнения ФОМ, ВЦИОМ, Левада-центр

Можно выбрать:

1.1. Макроэкономические показатели для одной страны, например, ВВП, уровень безработицы, инфляция.

1.2. Социодемографические показатели для одной станы, например, численность населения, продолжительность жизни, показатели уровня развития здравоохранения.

1.3. Аналогичные показатели для региона, области РФ.

1.4. Другие типы показателей: климат, экология.

1.5. Смешанные данные, например, развитие промышленности и уровень загрязнения окружающей среды.

2.Проверьте, действительно ли данные за все года собраны по единой методике и имеют одинаковые единицы измерения.

3.Постройте графики изменения выбранных показателей во времени в едином масштабе.В отчете график должен быть представлен в корректном виде, c правильными обозначениями осей!

4.Проверьте отсутствие периодизации. Это можно сделать визуально или рассчитав средние значения для различных интервалов и проверив гипотезу об их равенстве. Если видно, что происходили качественные изменения, такой ряд неприемлем. Прогноз можно делать, если длина однородного периода в 3 больше периода упреждения.

5.Утвердите перечень переменных у преподавателя.

Каждый вариант данной работы должен быть уникальным!

6.Создайте для каждой переменной таблицу вида таблицы 5.

Таблица 5. Показатели временного ряда для <выбранная переменная>.

Год

Номер периода

Значение переменной, едизм

Базовые показатели

Цепные показатели

Темп роста Темп прироста Темп роста Темп прироста
2010 1          
2014 5          
2015 6          
Среднее значение Х   Х Х    

 

Обычно переменные приводятся в среднегодовых значениях (ВВП, объем импорта и экспорта, уровень рождаемости, уровень безработицы, средняя заработная плата). В этом случае используется среднее значение для интервального ряда определяется по формуле

               ,

Численность населения приводится либо как среднее значение за год, либо на определенную дату (обычно на конец года). В последнем случае используется формула среднего для моментногоряда–среднее хронологическое:

             .

Средний цепной темп роста рассчитывается по формуле среднего геометрического

                              .

Средний цепной темп прироста равен.

                             .

7.Для каждого ряда определите значение автокорреляции с лагом 1. Ее наличие показывает наличие тренда и возможность построения регрессионной функции.

7.1. StatisticsàAdvanced linear/nonlinear models à Time series/forecasting.

7.2. Выборпеременной. OK àокно Time series analysis.

7.3. В окне снова выбирается переменная. Здесь можно менять имя переменной двойным щелчком.

7.4. Задается Number of backups = 5.

7.5. Lock:L – заблокирована, нельзя удалить или переименовать.

7.6. Переменные можно сохранять (Нажать Save) или удалять.

7.7. Вкладка Missingdata – можно заполнять пропуски.

7.8. Длинная кнопка OK. Видно окно преобразования переменных.

7.9. Убираемненужныйграфик: Вкладка Review and plot à Plot variable series after each transformation.

8.Строимграфикпеременной: Вкладка Review and plot à Review highlighted variable ----Plot.

9.Строимавтокорреляции. Вкладка Autocorrs à Autocorrelationsà number of lags = 2. Видимграфик.

10.Lag – сдвиг. Corr – автокорреляция, p – вероятность того, что ее нет, то есть это был белый шум.

11.Лаг 1,2,3,4,5 – значимая положительнаякорреляций, значит, тренд есть!

12.Лаг 6,7,8,9 – малые значения. Автокорреляции нет. Тренда нет. В этом случае можно в качестве прогнозируемого значения взять среднее значение ряда, а в качестве доверительного интервала для достоверности 95% - удвоенное среднеквадратическое отклонение.

13.Лаг 12,13,14,15 Взято слишком много лагов!– замнем для ясности (большая корреляция, но смысла нет, так как осталось мало значений: лаг 15 из 26 лет – остается 10 значений). Минимум – лаг 1, достаточно – 3.

14.Если автокорреляция с лагом 1 значима и потом убывает, тренд есть, можно строить регрессионную функцию.

15.Строится регрессия, как в предыдущей работе. Те же выводы. Но в качестве переменной-фактора (назависимой) берется время.

16.Определяется автокорреляция в остатках. ОкноTransformationofvariablesàвкладкаf(x,y) àResidualizing (x=x-(a+b*y(lag))) задайтеa=B0 изрегрессионногоанализа, b=B1 из регрессионного анализаàOK (transformselectedvariables).

17.В списке появилась новая переменная. Можно ее переназвать. Для сохранения нажать Save. В новом листе данных появился новый столбец.

18.Постройте для новой переменной автокорреляцию. Если автокорреляция с лагом 1 значима, есть подозрение, что результаты окажутся неверными, так как какой-то тренд остался.

19.Если уравнение регрессии решено использовать, то для прогноза (не более трети длины ряда) следует подставить значение нужного периода времени, находящегося за пределами имеющегося ряда. Доверительный интервал и достоверность можно принять такими же, как и для предыдущего регрессионного анализа.

20.Эти же действия следует повторить для двух других переменных.

21.Постройте график cдоверительными интервалами.GraphsàScatterplotsà<задайте переменные для Xи Y>àConfidence 0,95àOK.

22.Постройте график, указав вместо доверительного интервала Prediction. Будут показан диапазон прогноза с достоверностью 95%.

23.Отчет по этой части должен содержать:

23.1. Ссылки на источники данных.

23.2. Фрагмент таблицы данных.

23.3. Таблицы базовых и цепных показателей для каждой переменной.

23.4. Материалы проверки отсутствия периодизации

23.5. Обоснование выбора части ряда для прогноза и определение периода упреждения.

23.6. Графики изменения переменных и корректно указанными осями и масштабом.

По каждой переменной:

23.7. Проверку результата наличия тренда;

23.8. Вид уравнения регрессии.

23.9. Диапазон возможности прогнозирования

23.10. Значимость параметров уравнения

23.11. Значимость уравнения в целом

23.12. Процент вариации, объясняемый данным уравнением.

23.13. Значение прогноза для будущих периодов в формате:

Прогноз на период ___ (ВВП) = ______+______*(период)

± ______ с достоверностью 95%.

23.14. Графики с регрессионной функцией и для прогноза.

24.Измените вид регрессионной функции, требуется попробовать хотя бы 3 варианта, возможно, для различных переменных. Результаты – те же. Подробное описание – в методичке Куприенко.

25.Изучите кросс-корреляцию выбранных переменных. Подробное описание – в методичке Куприенко.

26.Постройте факторно-временную регрессионную модель.

27.Согласно выдвинутой гипотезе укажите зависимую и независимые переменные. В качестве одной из независимых переменных возьмите время.

28.Дальнейшие действия полностью аналогичны работе с множественной регрессией. Выводы также аналогичны.

29.Результат работы:

29.1. Вид уравнения.

29.2. Значимость параметров уравнения.

29.3. Значимость уравнения в целом.

29.4. Какую часть изменений зависимой переменной объясняет уравнение.

29.5. Можно ли использовать уравнение для прогноза значения зависимой переменной?

29.6. В каких диапазонах справедливы прогнозы?

29.7. Итог всего исследования в формате:

В пределах (переменной 1) от _____ до _____

            и (периодов времени) от _____ до _____

(зависимая переменная) = ______

                       +______*(переменная1)

                       +______*(период_времени)

± ______ с достоверностью 95%.


Дата добавления: 2018-04-04; просмотров: 250; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!