Оценка точности аппроксимации



 

Различия в представлении эмпирической зависимости по отношению к моделирующей ее аналитической функции оценивается коэффициентом аппроксимации ε, который вычисляется как среднее модуля величин эмпирических и теоретических значений, отнесенных к соответствующим эмпирическим значениям. То есть относительная ошибка аппроксимации данной нам эмпирической зависимости с помощью линейной функции может быть вычислена как:

 

     1      │ yi - ŷi │                   

ε = — ∑│ ———│∙ 100%.                                                            (22)                    

     n │ yi

 

Схема вычисления суммы в выражении (22) приведена в рабочей таблице 3.

 

                                                                                             Таблица 3

Рабочая таблица для вычислении суммы выражения (22)

   i     yi  ŷi по выражению (20) │yi  - ŷi │yi  - ŷi / yi
   1    2    3    4    5     1     1     1     3     4    0,4    1,2    2,0    2,8    3,6     0,6    0,2    1,0    0,2    0,4 0,60 0,20 1,00 0,06 0,13

                                                                                ∑ │ yi  - ŷi / yi │ = 1,99

 

               1

Тогда ε = — ∙ 1,99 ∙ 100% = 38,6%,

               5

 что, конечно, свидетельствует о далеко не малой ошибке. Обычно аппроксимирующую функцию подбирают так, чтобы ошибка аппроксимации не превышала единиц процентов. В данном случае задачу аппроксимации методом наименьших квадратов было бы целесообразно решить еще раз, скажем, для степенной или показательной функции. Однако вычисления по сравнению с линейной функцией немного усложнятся вследствие необходимости предварительной линеаризации аппроксимирующей функции.

При использовании стандартных компьютерных пакетов прикладных программ Статграфик, SPSS и др. от пользователя требуется лишь занесение исходных данных. Затем они используются всеми имеющимися парными функциями различного вида, и пользователю предоставляется возможность выбрать ту функцию (не обязательно линейную), относительная ошибка аппроксимации которой является минимальной среди имеющегося встроенного банка функций ŷi.

 

                    

Вычисление коэффициента линейной корреляции

Коэффициент линейной корреляции может быть вычислен по следующей формуле:

        N ∑xy - ∑x ∑y

ρ = ———————————————.                                        (23)

  {[N ∑x2 - (Sх )2] [N ∑y2 – (Sy2)]} 1/2

Для нашего примера

 

               5 • 38 – 15 • 10                        40

ρ = ——————————————  = ——   = 0,894.  

   ([5 • 55 - (15)2] [5 • 28 – (102)]}1/2        44,72

Отметим, что по степени тесноты между двумя переменными по своей абсолютной величине (модулю) корреляционные связи считаются «слабыми» при │ρ │ = 0,2 – 0,3; «существенными» при │ρ │= 0,5 – 0,7 и «сильными» при │ρ│≈ 0,9. Корреляция отсутствует при │ρ│≈ 0.

Область изменения коэффициента линейной корреляции находится в пределах: - 1 ≤ ρ ≤ + 1.

В данном случае имеем сильную зависимость между временем ( в месяцах) и величиной прибыли (в тыс. руб.).

Нам остается лишь выяснить степень достоверности вычисленной тесноты связи.

 

Формирование и проверка нулевых гипотез

 

В общем случае для оценки тесноты связи аргумента и функции, значимости полученных коэффициентов и надежности уравнения регрессии исследователь формирует для каждого названного этапа т.н. соответствующие «нулевые гипотезы» и производит их верификацию по соответствующим правилам.

Общее правило формирования нулевых гипотез состоит в следующем. Сначала формулируется утверждение о том, что то, что мы собираемся установить в качестве реально существующего с заданным уровнем значимости, как бы отсутствует. Здесь рассмотрим лишь формирование и поверку нулевой гипотезы Н0 относительно тесноты связи аргумента и функции.

Нулевая гипотеза Н0 в данном случае формируется так.  X)ыль У и время Х функционально не связаны ( У = игипотезы относительно тесноты связи аргумента и функ2цииПрибыль «у» и время «х» функционально не связаны: у ≠ f(х), или, иными словами, размер прибыли от времени не зависит.

Для опровержения или принятия данной гипотезы необходимо произвести дополнительные вычисления – рассчитать параметр tрас и сравнить его значение с табличным параметром tтаб  с заданным уровнем значимости Р (в процентах или относительных единицах) либо с заданным уровнем ошибок ά (в относительных единицах):

 

      │ρ│(N – 2)1/2

tрас  = —————— .                                                                            (24)

          (1 - ρ2)1/2  

 

Вполне очевидно, что величина tрас всегда больше нуля. При подстановке наших данных в выражение (24) получим:

 

      │ρ│(N – 2)1/2 0,894 • (5 – 2)1/2

tрас  = ——————  = —————— = 4,76.                                                                               

          (1 - ρ2)1/2    (1 – 0,894)1/2

 

Далее производится сравнение расчетного и табличного параметра. При этом, если

                        tрас  ≥ tтаб ,                                                                         (25)

 

с заданным уровнем значимости Р (%), то нулевая гипотеза Н0 отвергается, то есть связьмежду переменными х и у существует и является значимой. То есть у = f(x). Нулевая гипотеза отвергается. Если нестрогое неравенство (25) не выполняется, то нулевая гипотеза принимается для заданного уровня значимости.

Для определения табличных значений tтаб воспользуемся таблицей Стьюдента, приведенной в табл. 4. Вход в таблицу осуществляется по числу степеней свободы df, которое вычисляется следующим образом:

 

                        df = N – 1.                                                              (26)   

 

В нашем случае df = 5 – 1 = 4.

Обычно в социально-экономических исследованиях приняты уровни значимости Р в 90%, 95% и 99%, что соответствует значениям ά в 0,10; 0,05 и 0,01 – соответственно.

Здесь неравенство (25) выполняется на строке таблицы (выделено шрифтом) для вероятности более, чем 99% (т.е. с ошибкой менее 1%).

 

                                                                      Таблица 4

Значение t-критерия Стьюдента при уровне значимости ά    

Число степеней

свободы df

Упрвень значимости ά

0,10  0,05  0,01
             1              2              3              4              5              6              7              8              9            10 6,3138 2,2900 2,3534 2,1318 2,0150 1,9432 1,8946 1,8595 1,8331 1,8125 12,706 4,3027 3,1825 2,7764 2,5706 2,4469 2,3646 2,3060 2,2622 2,2281 63,657 9,9248 5,8409 4,6041 4,0321 3,7074 3,4995 3,3554 3,2498 3,1693

 

Следовательно, можно сделать следующий вывод: нулевая гипотеза о несвязанности аргумента и функции может быть опровергнута с вероятностью, не менее 99% (или принята с вероятностью менее 1%). То есть, отвергая Н0, мы можем ошибиться менее, чем в одном случае из ста, тогда как принимая ее, мы ошибемся в более, чем 99-ти случаях из 100.

Таким образом, полученным результатам прогнозирования мы в известном смысле доверяем. Задача решена.

Общие выводы

Вначале мы располагали лишь эмпирическими данными между временем (в месяцах) и размерами прибыли (в тыс. руб.). В результате применения метода наименьших квадратов для аппроксимирующей функции линейного вида получили значения коэффициентов а и b, построили прогноз на шестой месяц, рассчитали ошибку аппроксимации, оценили степень тесноты связи функции и аргумента и сделали выводы о приемлемости нулевой гипотезы с помощью параметра Стьюдента.

Хотя и аргумент и функция связаны достаточно тесно, однако ошибка аппроксимации довольно высока. Поэтому надежность полученного прогноза вызывает известные сомнения. Для повышения точности прогноза необходимо попытаться аппроксимировать данную нам эмпирическую зависимость каким-либо другим видом парной зависимости (показательной, степенной и др.).

 

 

Далее предлагается провести подобные расчеты для вариантов, приведенных в табл. 5 и интерпретировать полученные результаты по следующему алгоритму.

 


Дата добавления: 2021-01-20; просмотров: 628; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!