Данные для самостоятельной работы

Лабораторная работа №4

Корреляционно-регрессионный анализ

Задание

Для 25 однотипных предприятий имеются данные о затратах на модернизацию производства и о приросте  прибыли.

  • Построить поле корреляции;
  • Выбрать подходящие уравнения регрессии, построить их, построить графики;
  • Для каждого уравнения регрессии найти среднюю ошибку аппроксимации, сделать выводы о том, какое уравнение регрессии предпочтительнее в данном случае;
  • Оценить тесноту связи;
  • В случае линейной регрессии построить доверительные интервалы для параметров регрессии и линейного коэффициента корреляции;
  • Найти коэффициент эластичности для каждого вида регрессии;
  • Спрогнозировать возможный прирост прибыли, если затраты на модернизацию составят 100 тыс. руб.;
  • В случае линейной регрессии найти доверительный интервал для прогнозного значения.
№ п/п Затраты на модернизацию, тыс. руб. Прирост прибыли, тыс. руб.
1 18,35 13,17
2 22,17 19,25
3 25,94 20,56
4 27,33 22,78
5 27,89 24,98
6 29,14 26,94
7 30,22 25,89
8 35,15 33,05
9 39,78 33,98
10 44,21 39,84
11 45,89 39,58
12 49,99 43,11
13 51,25 43,21
14 52,98 42,95
15 55,14 43,99
16 57,03 43,87
17 62,17 45,66
18 64,13 48,85
19 66,08 49,11
20 69,74 49,25
21 70,25 51,64
22 71,11 49,95
23 77,69 52,17
24 80,14 53,48
25 85,46 56,48

Выполнение работы

Внимание! При создании таблиц используйте в качестве образца таблицы, приведённые на рисунках, при этом вы должны вводить данные в те же ячейки, что и на рисунке (столбцы и номера строк должны совпадать). В противном случае вычисления по формулам, данным в работе, будут неверными.

Построение поля корреляции, определение вида регрессии

  1. Создайте новую книгу MS Excel;
  2. На первом листе создайте таблицу с исходными данными (см. рисунок):

  1. Построим поле корреляции:
    1. Выделите диапазон ячеек В2:С26.
    2. Вызовите пункт меню Вставка/Диаграмма…
    3. В открывшемся диалоговом окне выберите вид диаграммы – Точечная, нажмите кнопку Готово.
    4. На текущий лист будет добавлена диаграмма:

    1. Для этой диаграммы скройте легенду, добавьте подписи осей, добавьте название.

  1. Определим вид приближающей регрессии. По полю корреляции можно предположить, что это может быть линейная, степенная или логарифмическая функция. MS Excel позволяет добавлять в диаграммы линии тренда (кривые приближающих функций), эта возможность позволяет пользователю более точно определить вид регрессии.
    1. Выделите диаграмму (щёлкните на ней левой кнопкой мыши).
    2. В главном меню окна должен появиться пункт Диаграмма. Выберите в этом пункте подпункт Добавить линию тренда.
    3. В открывшемся диалоговом окне выберите тип линии тренда – линейная. Нажмите кнопку ОК. В результате линия тренда будет добавлена на диаграмму. По полученному графику можно предположить, что линейная регрессия может быть использована в данном случае.

    1. Аналогичным образом добавьте на эту же диаграмму ещё одну линию тренда – логарифмическую. По графику будет видно, что логарифмическая регрессия достаточно хорошо отражает зависимость величин.

    1. Аналогичным образом добавьте на эту же диаграмму ещё одну линию тренда – полиномиальную, степень – 2 (это будет график квадратичной регрессии). По графику видно, что квадратичная регрессия так же может быть использована в данном случае (её график практически совпадёт с графиком логарифмической регрессии).

    1. Можно так же добавить на диаграмму экспоненциальную и степенную линии тренда, но для них сразу можно сделать вывод о том, что эти типы регрессий не подходят в данном случае.

Вывод: Для имеющихся данных следует использовать линейную, квадратичную или логарифмическую регрессию.

 

Линейная регрессия

       Линейная регрессия задаётся уравнением:

      

       Параметры а и b находятся по формулам:

      

  1. Создайте на втором листе книги MS Excel таблицы для вычислений (см. рисунок).

  1. Установите курсор в ячейку С2 и введите формулу: =А2^2. Скопируйте эту формулу вниз в диапазон ячеек С3:С26 (таким образом мы вычислим квадраты факторного признака Х – затрат на модернизацию производства).
  2. Установите курсор в ячейку D2 и введите формулу: =A2*B2. Скопируйте эту формулу вниз в диапазон ячеек D3:D26 (для каждой пары Х и У мы вычисляем величину ).
  3. В ячейке I1 с помощью встроенной функции вычислите среднее значение для данных из диапазона А2:А26 (находим величину ).
  4. В ячейке I2 с помощью встроенной функции вычислите среднее значение для данных из диапазона В2:В26 (находим величину ).
  5. В ячейке I3 с помощью встроенной функции вычислите среднее значение для данных из диапазона С2:С26 (находим величину ).
  6. В ячейке I4 с помощью встроенной функции вычислите среднее значение для данных из диапазона D2:D26 (находим величину ).
  7. Установите курсор в ячейку H8 и введите формулу: =(I4-I2*I1)/(I3-I1*I1) (находим параметр b уравнения линейной регрессии по формуле).
  8. Установите курсор в ячейку I8 и введите формулу: =I2-H8*I1 (находим параметр а уравнения линейной регрессии по формуле).
  9. MS Excel позволяет найти параметры уравнения линейной регрессии с помощью специальной формулы:
    1. Выделите ячейки H9:I9.
    2. Вызовите пункт меню Вставка/Функция.
    3. В открывшемся диалоговом окне выберите категорию Статистические, затем в этой категории выберите функцию ЛИНЕЙН, нажмите ОК.
    4. В открывшемся диалоговом окне в поле Известные значения Y задайте диапазон В2:В26, в поле Известные значения Х задайте диапазон А2:А26. Нажмите одновременно клавиши Ctrl+ Shift+ Enter (мы обрабатываем диапазоны ячеек как единый массив).
  10. Если все действия выполнены верно, таблица будет иметь вид:

Вывод: уравнение линейной регрессии имеет вид

  1. Построим график линейной регрессии и график эмпирической функции в одной системе координат.
    1. Вычислим теоретические значения прироста прибыли, используя полученное уравнение линейной регрессии (то есть будем подставлять имеющиеся значения Х в полученное уравнение регрессии). Установите курсор в ячейку Е1 и введите формулу: =$H$8+$G$8*A2. Скопируйте эту формулу в диапазон ячеек Е2:Е26.
    2. Выделите два несмежных диапазона А2:А26 и Е2:Е26 (для выделения несмежных диапазонов удерживайте нажатой клавишу Ctrl).
    3. Вызовите пункт меню Вставка/Диаграмма. В открывшемся диалоговом окне выберите тип диаграммы – точечная. Нажмите кнопку Готово. Вы должны получить следующий график:

    1. Скройте легенду.
    2. Двойным щелчком на маркерах построенной диаграммы вызовите окно свойств. В этом окне в левой его части установите тип линии – обычная (вместо отсутствует).
    3. Выделите диаграмму и в пункте меню Диаграмма выберите пункт Добавить данные.
    4. В открывшемся диалоговом окне задайте диапазон В2:В26. Нажмите ОК.
    5. Задайте для диаграммы заголовок и подписи осей.

  1. Найдём среднюю ошибку аппроксимации уравнения линейной регрессии по формуле:

Средняя ошибка аппроксимации должна быть не больше 10% - 12%.

    1. Установите курсор в ячейку F2 и введите формулу: =ABS((B2-E2)/B2). Скопируйте эту формулу вниз в диапазон ячеек F3:F26.
    2. Установите для ячейки I11 процентный формат и введите в эту ячейку формулу: =СУММ(F2:F26)/I5 (вычисляем среднюю ошибку аппроксимации по формуле).
    3. Вы должны получить стандартную ошибку аппроксимации 7,82%, это означает, что использование линейной регрессии в данном случае допустимо.

А = 7,82%

  1. Оценим тесноту связи с помощью линейного коэффициента корреляции, который вычисляется по формуле:

    1. В ячейке I20 рассчитайте среднее квадратическое отклонение для факторного признака Х, используя встроенную функцию СТАНДОТКЛОН ( ) (диапазон ячеек А2:А26).
    2. Аналогичным образом в ячейке I21 рассчитайте среднее квадратическое отклонение для результативного признака Y.
    3. Вычислим коэффициент корреляции по формуле. Установите курсор в ячейку I13 и введите формулу: =(I4-I2*I1)/(I20*I21).
    4. MS Excel содержит встроенную функцию, позволяющую вычислить линейный коэффициент корреляции. Установите курсор в ячейку J13 и вызовите пункт меню Вставка/Функция. В категории функций статистические выберите функцию КОРРЕЛ ( ). В открывшемся диалоговом окне в поле Массив 1 задайте диапазон А2:А26 (значения признака Х), а в поле Массив 2 – диапазон В2:В26 (значения признака Y). Нажмите одновременно клавиши Ctrl+ Shift+ Enter (мы обрабатываем диапазоны ячеек как единый массив). Внимание! Результаты, полученные по формуле и с помощью функции, могут различаться! Это связано с накопившейся погрешностью вычислений.

r>0.9, следовательно, между величинами присутствует сильная прямая взаимосвязь.

  1. Оценим значимость параметров уравнения регрессии, используя критерий Стьюдента. Нам нужно будет вычислить фактические значения t-критерия по формулам:

В этих формулах:

,

- стандартные ошибки.

    1. Создайте заготовку таблицы для вычислений на том же рабочем листе (см. рисунок).

    1. Установите курсор в ячейку L2 и введите формулу: =(A2-$I$1)^2. Скопируйте эту формулу вниз в диапазон ячеек L3:L26 (для каждого значения признака Х мы находим величину ).
    2. Установите курсор в ячейку М2 и введите формулу: =(B2-E2)^2. Скопируйте эту формулу вниз в диапазон ячеек М3:М26 (находим величину ).
    3. В ячейке Р1 с помощью функции вычислите сумму чисел из диапазона ячеек С2:С26 (сумма квадратов аргумента Х, она используется в формуле).
    4. В ячейке Р2 с помощью функции вычислите сумму чисел из диапазона ячеек L2:L26.
    5. В ячейке Р3 с помощью функции вычислите сумму чисел из диапазона ячеек М2:М26.
    6. Установите курсор в ячейку I22 и введите формулу: =КОРЕНЬ(P3/((I5-2)*P2)) (находим величину ).
    7. Установите курсор в ячейку I23 и введите формулу: =КОРЕНЬ((P3*P1)/(I5*(I5-2)*P2)) (находим величину ).
    8. Установите курсор в ячейку I15 и введите формулу: =I8/I23 (находим величину ).
    9. Установите курсор в ячейку I16 и введите формулу: =H8/I22 (находим величину ).
    10. Найдём табличное значение t-критерия. В нашем случае число степеней свободы , уровень значимости  возьмём равным 0,05. Установите курсор в ячейку I18 и введите формулу: =СТЬЮДРАСПОБР(0,05;I5-2).
    11. Вы должны получить следующие результаты:

Выводы:  и  - с вероятностью 95% гипотеза о случайной природе формирования параметров линейной регрессии отвергается, параметры уравнения а и b признаются значимыми.

  1. Оценим значимость линейного коэффициента корреляции. Для этого используем следующие формулы:

 - стандартная ошибка.

    1. Установите курсор в ячейку I24 и введите формулу: =КОРЕНЬ((1-I13^2)/(I5-2)) (находим стандартную ошибку по формуле).
    2. Установите курсор в ячейку I17 и введите формулу: =I13/I24 (находим фактическое значение t-критерия).
    3. Вы должны получить следующие результаты:

Вывод: - с вероятностью 95% можно утверждать, что коэффициент линейной корреляции не случайно отличается от нуля, поэтому он признаётся значимым.

  1. Построим доверительные интервалы для параметров уравнения линейной регрессии. Для этого используем следующие формулы:

В этих формулах:

 - предельные ошибки показателей.

    1. Создайте на листе заготовку таблицы для вычислений (см. рисунок).

    1. Вычислим . Установите курсор в ячейку I26 и введите формулу: =I18*I23.
    2. Вычислим . Установите курсор в ячейку I27 и введите формулу: =I18*I22.
    3. Самостоятельно рассчитайте границы доверительных интервалов, используя формулы приведённые выше. Вы должны получить следующие результаты:

       Вывод: с вероятностью 95% можно утверждать, что параметр а уравнения линейной регрессии принадлежит промежутку от 5,07 до 11,89, а параметр b принадлежит промежутку от 0,54 до 0,67.

  1. Построим доверительный интервал для линейного коэффициента корреляции. Для этого будем использовать Z-распределение Фишера:

Нам потребуется получить интервальные оценки по формуле:

То есть вначале мы найдём доверительный интервал для величины z.

В этой формуле:

 - значение случайной величины, подчиняющейся стандартному нормальному распределению, соответствующему вероятности  (альфа – уровень значимости).

 - значение Z-распределения Фишера, соответствующее полученному значению линейного коэффициента парной корреляции (нам нужно будет подставить значение коэффициента корреляции в формулу для z).

Граничные значения доверительного интервала для коэффициента корреляции получают из границ доверительного интервала для z с помощью функции, обратной Z-распределению Фишера.

Обратное значение для z будет определяться по формуле:

То есть, нам нужно будет подставить в эту формулу значения границ доверительного интервала для z и в результате мы получим доверительные интервалы для r.

    1. Создайте заготовку таблицы для вычислений (см. рисунок).

    1. Найдём значение . В ячейку В30 введите формулу: =1-0,05/2 (0,05 – это уровень значимости ).
    2. Найдём значение величины . Мы имеем дело с величиной, имеющей стандартное нормальное распределение. Таким образом, мы ищем значение величины, имеющей стандартное нормальное распределение, при уровне значимости . Используем встроенную функцию. В ячейку В31 введите формулу: =НОРМСТОБР(B30).
    3. В ячейку В32 введите формулу: =0,5*LN((1+I13)/(1-I13)) (находим значение  по формуле , подставляя в неё найденное значение коэффициента корреляции).
    4. В ячейку А36 введите формулу: =B32-B31*КОРЕНЬ(1/(I5-3)) (находим нижнюю границу доверительного интервала для величины ).
    5. В ячейку В36 введите формулу: =B32+B31*КОРЕНЬ(1/(I5-3) (находим верхнюю границу доверительного интервала для величины ).
    6. В ячейку А40 введите формулу: =(EXP(2*A36)-1)/(EXP(2*A36)+1) (находим нижнюю границу доверительного интервала для коэффициента корреляции r по формуле , подставляя в неё значение нижней границы доверительного интервала для ).
    7. В ячейку В40 введите формулу: =(EXP(2*B36)-1)/(EXP(2*B36)+1) (находим верхнюю границу доверительного интервала для r).
    8. Вы должны получить следующие результаты:

       Вывод: с вероятностью 95% можно утверждать, что линейный коэффициент корреляции находится в пределах от 0,85 до 0,97.

  1. Спрогнозируем прирост прибыли предприятия, если затраты на модернизацию составят 100 тыс. руб.
    1. В ячейку А27 введите значение 100 (это прогнозное значение факторного признака Х).
    2. Из ячейки Е26 скопируйте формулу в ячейку Е27. В результаты вы получите искомое ожидаемое значение прироста прибыли (прогнозное значение результативного признака Y). Вы должны получить 68,97 тыс. руб.

Ожидаемый прирост прибыли при затратах на модернизацию производства в 100 тыс. руб. составляет 68,97 тыс. руб.

  1. Найдём доверительный интервал для прогнозного значения. Для этого нам будет нужно вычислить стандартную ошибку прогноза по формуле:

, где - остаточное среднее квадратическое отклонение.

В случае линейной регрессии: m = 1 (в уравнении регрессии один параметр рядом с неизвестным).

Доверительные интервалы прогнозного значения определяются по формулам:

, где

    1. Создайте заготовку таблицы для последующих вычислений (см. рисунок).

    1. Введите в ячейку F31 формулу: =КОРЕНЬ(СУММ(M2:M26)/(I5-2)) (находим величину ).
    2. Введите в ячейку F32 формулу: =F31*КОРЕНЬ(1+1/I5+((F30-I1)^2)/СУММ(L2:L26)) (находим стандартную ошибку прогноза).
    3. Введите в ячейку F33 формулу: =F32*I18 (находим величину ).
    4. Введите в ячейку Е37 формулу: =E27-F33 (находим нижнюю границу доверительного интервала).
    5. Введите в ячейку F37 формулу: =E27+F33 (находим верхнюю границу доверительного интервала).
    6. Вы должны получить следующие результаты:

       Вывод: с вероятность 95% при условии линейной зависимости между изучаемыми признаками можно утверждать, что при затратах на модернизацию производства в 100 тыс. руб. ожидаемый прирост прибыли будет в пределах от 61,97 тыс. руб. до 75,97 тыс.руб.

  1. Найдём средний коэффициент эластичности. Коэффициент эластичности показывает, на сколько процентов в среднем по совокупности изменится результат Y от своей величины при изменении фактора Х на 1% от своего значения. Он рассчитывается по формуле:

В нашем случае: . Отсюда: .

a. Сделайте заготовку таблицы (см. рисунок).

b. Введите в ячейку F39 формулу: =0,6*I1/I2. Вы должны получить результат Э = 0,78.

Вывод: при изменении значения признака Х (затрат на модернизацию) на 1% значение признака Y (прирост прибыли) в среднем изменится на 0,78%.

Квадратичная регрессия

Квадратичная регрессия задаётся уравнением:

.

Параметры этой функции находятся из системы уравнений:

.

В этой системе:

Таким образом, все эти параметры являются средними величинами.

  1. На новом листе книги MS Excel создайте таблицы для вычислений (см. рисунок).

  1. В ячейку С2 введите формулу: =A2^4. Скопируйте эту формулу вниз в диапазон ячеек С3:С26.
  2. В ячейку D2 введите формулу: =A2^3. Скопируйте эту формулу вниз в диапазон ячеек D3:D26.
  3. В ячейку E2 введите формулу: =A2^2. Скопируйте эту формулу вниз в диапазон ячеек E3:E26.
  4. В ячейку F2 введите формулу: =E2*B2. Скопируйте эту формулу вниз в диапазон ячеек F3:F26.
  5. В ячейку G2 введите формулу: =A2*B2. Скопируйте эту формулу вниз в диапазон ячеек G3:G26.
  6. В ячейке А27 найдите значение величины  как среднее значение чисел из диапазона ячеек А2:А26 (используйте встроенную функцию MS Excel). Эту формулу скопируйте вправо в диапазон ячеек В27:G27 для того, чтобы получить значения остальных параметров системы уравнения (то есть в итоге будет подсчитано среднее значение для каждого столбца).
  7. Вы должны получить следующую таблицу:

  1. Таким образом, нам требуется решить следующую систему уравнений:

       Эту систему уравнений можно записать в матричном виде:

      

Здесь: А – матрица коэффициентов при неизвестных, Х – вектор-столбец неизвестных переменных, В – вектор-столбец свободных коэффициентов. Мы можем записать:

.

Следовательно, для того, чтобы найти неизвестные, нам нужно вычислить матрицу  (матрица, обратная для матрицы А) и умножить её на вектор-столбец свободных коэффициентов. Полученный в результате этого умножения вектор столбец будет содержать искомые значения неизвестных.

    1. Создайте заготовки таблиц для вычислений (см. рисунок).

    1. Заполним данными матрицу А. Внимание: во избежание накопления погрешностей, связанных с округлением, создавать эту таблицу нужно следующим образом:

i. Установите курсор в ячейку L1 и задайте формулу: =C27. В результате в ячейку L2 будет подставлено точное вычисленной значение .

ii. Аналогичным образом заполните остальную таблицу, подставляя нужные значения параметров.

    1. Таким же образом задайте значения вектора-столбца свободных коэффициентов В.
    2. Найдём матрицу . Выделите диапазон ячеек L5:N7 и вызовите пункт меню Вставка/Функция. В открывшемся диалоговом окне укажите категорию функций Математические и выберите функцию МОБР ( ). В новом диалоговом окне задайте в качестве массива диапазон ячеек L1:N3. Нажмите одновременно клавиши Ctrl+ Shift+ Enter (мы обрабатываем диапазоны ячеек как единый массив).
    3. Для того, чтобы вычислить значения параметров с, b и а, умножим матрицу  на вектор-столбец В (именно в таком порядке). Выделите диапазон ячеек L9:L11 и вызовите пункт меню Вставка/Функция. В открывшемся диалоговом окне укажите категорию функций Математические и выберите функцию МУМНОЖ ( ). В открывшемся диалоговом окне в качестве Массива 1 задайте диапазон ячеек L5:N7 (матрица ), а в качестве Массива 2 задайте диапазон ячеек Р1:Р3 (вектор-столбец В). Нажмите одновременно клавиши Ctrl+ Shift+ Enter (мы обрабатываем диапазоны ячеек как единый массив).
    4. Вы должны получить следующие результаты:

Уравнение квадратичной регрессии имеет вид:

  1. Построим график квадратичной регрессии и график эмпирической функции в одной системе координат.
    1. Вычислим теоретические значения прироста прибыли, используя полученное уравнение квадратичной регрессии (подставим значения признака Х в полученное уравнение квадратичной регрессии). Установите курсор в ячейку Н1 и введите формулу: =$L$11+$L$10*A2+$L$9*A2*A2. Скопируйте эту формулу в диапазон ячеек Н2:Н26.
    2. Выделите два несмежных диапазона А2:А26 и Н2:Н26 (для выделения несмежных диапазонов удерживайте нажатой клавишу Ctrl).
    3. Вызовите пункт меню Вставка/Диаграмма. В открывшемся диалоговом окне выберите тип диаграммы – точечная. Нажмите кнопку Готово. Вы должны получить следующий график:

    1. Скройте легенду.
    2. Двойным щелчком на маркерах построенной диаграммы вызовите окно свойств. В этом окне в левой его части установите тип линии – обычная (вместо отсутствует).
    3. Выделите диаграмму и в пункте меню Диаграмма выберите пункт Добавить данные.
    4. В открывшемся диалоговом окне задайте диапазон В2:В26. Нажмите ОК.
    5. Задайте для диаграммы заголовок и подписи осей.

  1. Найдём среднюю ошибку аппроксимации уравнения линейной регрессии по формуле:

Средняя ошибка аппроксимации должна быть не больше 10% - 12%.

    1. Создайте заготовку таблицы (см. рисунок). Для ячейки L13 установите процентный формат.

    1. Установите курсор в ячейку I2 и введите формулу: =ABS((B2-Н2)/B2). Скопируйте эту формулу вниз в диапазон ячеек I3:I26.
    2. Введите в ячейку L13 формулу: =СУММ(I2:I26)/L14 (вычисляем стандартную ошибку аппроксимации по формуле).
    3. Вы должны получить стандартную ошибку аппроксимации 3,35%, это означает, что использование квадратичной регрессии в данном случае допустимо.
  1. Оценим тесноту связи с помощью индекса корреляции, который вычисляется по формуле:

- теоретические значения результативного признака, вычисленные с помощью уравнения регрессии.

    1. Сделайте заготовки таблиц для последующих вычислений (см. рисунок).

    1. В ячейке S2 вычислите среднее значение результативного признака – значений прибыли (диапазон ячеек В2:В26).
    2. Установите курсор в ячейку U2 и введите формулу: =(B2-$S$1)^2. Скопируйте эту формулу вниз в диапазон ячеек U3:U26 (находим величину ).
    3. В ячейку V2 введите формулу: =(B2-H2)^2. Скопируйте эту формулу вниз в диапазон ячеек V3:V26 (находим величину ).
    4. В ячейках U27 и V27 подсчитайте сумму значений соответствующих столбцов.
    5. Установите курсор в ячейку S3 и введите формулу: =КОРЕНЬ(1-V27/U27) (вычисляем индекс корреляции по формуле).
    6. Вы должны получить следующие результаты:

       Вывод: индекс корреляции , следовательно, связь между признаками очень тесная.

  1. Оценим значимость параметров уравнения квадратичной регрессии и индекса корреляции. Для этого будем использовать критерий Фишера: нам нужно будет сравнить фактическое значение критерия и табличное. Фактическое значение критерия рассчитывается по формуле:

В этой формуле: n – объём совокупности, m – число параметров при переменных. В нашем случае таких параметров два: b и c (параметр а является свободным коэффициентом).

Табличное значение F-критерия определяется для заданного уровня значимости  и степенях свободы k1 = m и k2 = n – m – 1.

a. Создайте заготовку таблицы для вычислений (см. рисунок).

b. Установите курсор в ячейку S6 и введите формулу: =(S4-S5-1)*S2*S2/(S5*(1-S2*S2)) (вычисляем фактическое значение F-критерия по формуле, подставляя нужные значения из ячеек на листе).

c. Получим табличное значение F-критерия с помощью встроенной функции для уровня значимости  и степеней свободы k1 = 2 и k2= n– m–1 =25–2–1=22. Установите курсор в ячейку S7 и вызовите пункт меню Вставка/Функция. Укажите категорию функций Статистические и выберите функцию FРАСПРОБР ( ). В открывшемся диалоговом окне укажите вероятность 0.05 (это уровень значимости ), Степень_свободы1 – ячейка S5, Степень_свободы2 – S4-S5-1.

d. Вы должны получить следующие результаты:

       Вывод:  - следовательно, гипотеза о случайной природе оцениваемых величин отвергается, и с вероятностью 95% можно утверждать, что параметры уравнения регрессии и индекс корреляции являются значимыми.

  1. Спрогнозируем прирост прибыли предприятия, если затраты на модернизацию составят 100 тыс. руб.
    1. В ячейку А29 введите значение 100.
    2. Из ячейки Н26 скопируйте формулу в ячейку Н29. В результаты вы получите искомое ожидаемое значение прироста прибыли. Вы должны получить 53,8 тыс. руб.

Ожидаемый прирост прибыли при затратах на модернизацию производства в 100 тыс. руб. составляет 53,8 тыс. руб.

  1. Найдём коэффициент эластичности. Он рассчитывается по формуле:

В нашем случае: . Отсюда: .

a. Сделайте заготовку таблицы (см. рисунок).

b. Введите в ячейку L16 формулу: =(1,35-0,02*A27)*A27/B27. Вы должны получить результат Э = 0,44.

Вывод: при изменении значения признака Х (затрат на модернизацию) на 1% значение признака Y (прирост прибыли) в среднем изменится на 0,44%.

 

Логарифмическая регрессия

       Логарифмическая регрессия имеет вид:

       Делаем подстановку:

      

Таким образом, мы перейдём к линейной функции:

Для нахождения значений параметров а и b нужно прологарифмировать значения аргумента в исходной таблице и найти для новой таблицы приближающую функцию в виде линейной и найденные значения параметров подставить в

       Таким образом, мы будем строить уравнение линейной регрессии для переменных  и  (  зависит от ).

  1. Вставьте в книгу MS Excel новый лист и создайте на нём заготовки таблиц для вычислений (см. рисунок).

  1. Прологарифмируем значения аргумента (значения признака Х), то есть получим значения . Установите курсор в ячейку С2 и введите формулу: =LN(A2). Скопируйте эту формулу вниз в диапазон ячеек С3:С26.
  2. Найдём параметры а и b уравнения линейной регрессии . Получите эти параметры самостоятельно в ячейках I5:J5 с помощью функции ЛИНЕЙН ( ). Вы должны получить следующие результаты:

       Вывод: уравнение логарифмической регрессии имеет вид -

  1. Построим график логарифмической регрессии и график эмпирической функции в одной системе координат.
    1. Вычислим теоретические значения прироста прибыли, используя полученное уравнение логарифмической регрессии (то есть будем подставлять имеющиеся значения Х в полученное уравнение регрессии). Установите курсор в ячейку D1 и введите формулу: =$J$5+$I$5*LN(A2). Скопируйте эту формулу в диапазон ячеек D2:D 26.
    2. Выделите два несмежных диапазона А2:А26 и D2:D26 (для выделения несмежных диапазонов удерживайте нажатой клавишу Ctrl).
    3. Вызовите пункт меню Вставка/Диаграмма. В открывшемся диалоговом окне выберите тип диаграммы – точечная. Нажмите кнопку Готово. Вы должны получить следующий график:

    1. Скройте легенду.
    2. Двойным щелчком на маркерах построенной диаграммы вызовите окно свойств. В этом окне в левой его части установите тип линии – обычная (вместо отсутствует).
    3. Выделите диаграмму и в пункте меню Диаграмма выберите пункт Добавить данные.
    4. В открывшемся диалоговом окне задайте диапазон В2:В26. Нажмите ОК.
    5. Задайте для диаграммы заголовок и подписи осей.

  1. Найдём среднюю ошибку аппроксимации уравнения линейной регрессии по формуле:

Средняя ошибка аппроксимации должна быть не больше 10% - 12%.

a. Установите курсор в ячейку Е2 и введите формулу: =ABS((B2-D2)/B2). Скопируйте эту формулу вниз в диапазон ячеек Е3:Е26.

b. Установите для ячейки J7 процентный формат и введите в эту ячейку формулу: (вычисляем среднюю ошибку аппроксимации по формуле).

c. Вы должны получить стандартную ошибку аппроксимации 2.90%, это означает, что использование линейной регрессии в данном случае допустимо.

А = 2,9% - использование логарифмической регрессии допустимо

  1. Вычислим индекс корреляции по формуле:

    1. В ячейке J9 найдите среднее значение результативного признака Y.
    2. В ячейку F2 введите формулу: =(B2-$J$9)^2. Скопируйте эту формулу вниз в диапазон ячеек F3:F26 (находим величину ).
    3. В ячейку G2 введите формулу: =(B2-D2)^2. Скопируйте эту формулу вниз в диапазон ячеек G3:G26 (находим величину ).
    4. Подсчитайте в ячейках F27 и G27 сумму значений из соответствующих столбцов.
    5. Рассчитаем индекс корреляции по формуле. В ячейку J10 введите формулу: =КОРЕНЬ(1-G27/F27). Вы должны получить индекс корреляции, равный 0,9952 (округлите результат до четырёх знаков после запятой).

Вывод:  - между признаками присутствует тесная связь.

  1. Оценим значимость параметров уравнения линейной регрессии с помощью F-критерия.

В этой формуле: n = 25 – объём совокупности, m = 1 – число параметров при переменных.

Табличное значение F-критерия определяется для заданного уровня значимости  и степенях свободы k1 = m = 1 и k2 = n – m – 1 = 25 – 1 – 1=23.

    1. Рассчитаем фактическое значение F-критерия по формуле. Установите курсор в ячейку J12 и введите формулу: =J10*J10*(J1-J2-1)/(J2*(1-J10*J10)).
    2. Получим табличное значение F-критерия с помощью встроенной функции для уровня значимости  и степеней свободы k1 = 1 и k2= n– m–1 =25–1–1=23. Установите курсор в ячейку J13 и вызовите пункт меню Вставка/Функция. Укажите категорию функций Статистические и выберите функцию FРАСПРОБР ( ). В открывшемся диалоговом окне укажите вероятность 0.05 (это уровень значимости ), Степень_свободы1 – ячейка J2, Степень_свободы2 – J1-J2-1.
    3. Вы должны получить следующие результаты:

       Вывод:  - следовательно, гипотеза о случайной природе оцениваемых величин отвергается, и с вероятностью 95% можно утверждать, что параметры уравнения регрессии и индекс корреляции являются значимыми.

  1. Спрогнозируем прирост прибыли предприятия, если затраты на модернизацию составят 100 тыс. руб.
    1. В ячейку А27 введите значение 100.
    2. Из ячейки D26 скопируйте формулу в ячейку D27. В результаты вы получите искомое ожидаемое значение прироста прибыли. Вы должны получить 60.44 тыс. руб.

Ожидаемый прирост прибыли при затратах на модернизацию производства в 100 тыс. руб. составляет 60.44 тыс. руб.

  1. Найдём коэффициент эластичности. Он рассчитывается по формуле:

В нашем случае: . Отсюда: .

c. Сделайте заготовку таблицы (см. рисунок).

d. Введите в ячейку J15 формулу: =I5/J9. Вы должны получить результат Э = 0,71.

Вывод: при изменении значения признака Х (затрат на модернизацию) на 1% значение признака Y (прирост прибыли) в среднем изменится на 0,71%.

Общие выводы:

  1. Между затратами на модернизацию производства существует тесная прямая связь, близкая к функциональной.
  2. В данном случае допустимо использовать линейную, логарифмическую и квадратичную регрессию. Параметры этих видов регрессий и соответствующих им индексов корреляции в данном случае будут значимыми.
  3. Наиболее удачным в данном случае будет использование логарифмической регрессии – для неё получена минимальная средняя ошибка аппроксимации.

Контрольные вопросы

  1. Для чего используется корреляционно-регрессионный анализ?
  2. Как определить вид уравнения регрессии, подходящий для изучаемых данных?
  3. Что такое средняя ошибка аппроксимации? Какие у неё допустимые пределы?
  4. Каким образом оценить тесноту связи между величинами?
  5. Как определить значимость параметров уравнения регрессии и индекса корреляции?
  6. Каким образом можно спрогнозировать значение результативного признака?

 

Самостоятельное задание

       Для приведённых ниже данных:

  • построить поле корреляции;
  • выбрать подходящий вид регрессии (не линейной);
  • построить уравнение линейной регрессии и уравнение регрессии выбранного вами вида;
  • получить среднюю ошибку аппроксимации для каждого уравнения регрессии, сделать вывод о том, как из них в данном случае предпочтительнее;
  • вычислить линейный коэффициент корреляции и индекс корреляции;
  • оценить значимость параметров уравнений регрессии и показателей тесноты связи;
  • для параметров уравнения линейной регрессии и линейного коэффициента корреляции определить доверительные интервалы;
  • с помощью обоих видов регрессий спрогнозировать значение результативного признака , используя прогнозное значение факторного признака ;
  • в случае линейной регрессии найти доверительный интервал для прогнозного значения результативного признака .

 

Данные для самостоятельной работы

K – порядковый номер студента по списку в журнале

Факторный признак Х Результативный признак Y
15,98*K 33,89*(K+1)
16,77*(K+1) 35,64*(K+1)
19,58*(K-1) 39,14*(K-1)
20,14*K 42,15*K
22,59*K 43,08*(K-1)
25,17*(K+1) 45,87*(K+1)
29,08*(K+1) 46,14*K
30,25*K 49,73*(K-1)
31,44*K 49,91*(K+1)
37,89*K 52,08*K
34,99*(K+1) 52,64*(K+1)
35,15*K 55,61*(K-1)
40,18*(K+1) 57,98*K
42,11*K 59,14*(K-1)
50,09*(K-1) 63,45*(K-1)

 


Дата добавления: 2019-02-12; просмотров: 103; Мы поможем в написании вашей работы!

Поделиться с друзьями:




Мы поможем в написании ваших работ!