Кореляційно-регресійний аналізпоказників діяльності підприємства



Однієї з типових задач обробки багатовимірних масивів даних є визначення кількісної залежності показників якості об'єкту від значень його параметрів і характеристик зовнішнього середовища.

Прикладом такої постановки задачі є встановлення залежності між часом обробки запитів до бази даних та інтенсивністю вхідного потоку. Час обробки залежить від багатьох чинників, зокрема від розміщення потрібної інформації на зовнішніх носіях, складності запиту. Отже, час обробки конкретного запиту можна вважати випадковою величиною. Але разом з тим, при збільшенні інтенсивності потоку запитів слід чекати зростання його середнього значення, тобто вважати, що час обробки і інтенсивність потоку запитів зв'язані кореляційною залежністю.

Кореляційний аналіз полягає у визначенні тісноти зв’язку між показниками.

Зв’язок між показниками є кореляційним, якщо закон розподілення однієї величини відповідає закону розподілення іншої, або, якщо зміна математичного очікування однієї величини впливає на зміну математичного очікування іншої. Для кількісної оцінки тісноти зв’язку використовується коефіцієнт кореляції (r), що змінюється у діапазоні від -1 до 1.

 

0<r£1 прямий зв’язок
-1£r<0 зворотній зв’язок
r=1 функціональний зв’язок – кожному значенню факторного показника відповідає одне значення результуючого
0£|r|£0,3 зв’язок відсутній
0,3<|r|£0,5 зв’язок слабий
0,5<|r|£0,7 зв’язок помірний
0,7<|r|£1 зв’язок сильний

 

Постановка задачі регресійного аналізу формулюється таким чином. Дана сукупність результатів спостереження, у якій один стовпецьвідповідає показнику, для якого необхідно встановити функціональну залежність з параметрами об’єктуі середовища, що представлені рештою стовпців. Позначимо цей показник через y, а решту m–1 (m > 1) стовпців – х1, х2, …, хm1.

Потрібно встановити кількісний зв’язок між показником та факторами. В такомувипадку задача регресійного аналізурозуміється як задача виявлення такої функціональної залежності y = f(x1, x2, …, хm-1), яка найкращим чином описує наявні експериментальні дані.

Допущення:

кількість спостережень є достатньою для проявлення статистичних закономірностей відносно факторів та їх взаємозв’язків;

дані, що обробляються містять деякі помилки, обумовлені погрішностями виміру, дією неврахованих випадкових факторів;

матриця результатів спостережень єєдиною інформацією прооб’єкт, що є у наявності перед началом дослідження.

Функція f(x1, x2, …, xm-1), що описує залежність показника від параметрів, називається рівнянням (функцією) регресії.

Розв’язання задачі регресійного аналізудоцільно розбити на декілька етапів:

попередня обробка даних;

вибір виду рівняння регресії;

розрахунок коефіцієнтів рівняння регресії;

перевірка адекватностіпобудови функції результатам спостереження.

Приклад проведення кореляційно-регресійного аналізу

1. Побудувати кореляційну матрицю для оцінки взаємозв’язкувихідних показників Z1,Z2,Z3,Z4

2. Визначити тісноту зв’язкувхідних показників Z2,Z3,Z4 з результуючим - продуктивності суспільної праці Z1.

3. Виходячи з тіснотизв’язкувхідних показників з показником продуктивності суспільної праці включитиїх у регресійні моделі

Z1=F(Z2,Z3,Z4).Z1=F(Z2,Z3).Z1=F(Z2,Z4).

Z1=F(Z3,Z4).Z1=F(Z2).Z1=F(Z3) Z1=F(Z4).

4. Оцінитиотримані регресійні моделііобрати найкращуза критеріями: R2 і F-критерій .

5. Визначити значенняпродуктивностіпрацівикористовуючи модель, поставляючи у неївхідні данііз першогорядкапервинної таблицііпорівняти з фактичним значенням.

Хід роботи

1. Вхідні дані

Продуктивність суспільної праці, Z1 Продуктивність праці в енергетиці,Z2 Продуктивність праці в будівництві,Z3 Продуктивність праці в торгівлі,Z4

0,45

2,04

5,37

0,70

0,50

2,48

6,27

0,73

1,03

3,23

10,90

1,63

0,94

3,57

9,28

1,31

0,93

4,30

8,71

1,22

0,98

2,23

8,63

1,29

0,87

2,58

8,77

1,24

0,82

2,83

7,15

1,07

0,75

2,87

5,52

0,91

1,42

2,91

3,95

0,81

0,72

2,96

3,11

0,87

1,09

1,65

3,80

2,16

1,06

0,74

2,85

2,15

2,10

0,67

2,82

2,10

 

2. Кореляційний аналіз. Виконати команду Сервис ® Анализ данных ® Корреляция. У діалоговому вікніввести: Входнойинтервал: $A$1:$D$1, группирование – по столбцам, Метки в первой строке -да.

Отримуємо на новому листі кореляційну матрицю

 

Продуктивність суспільної праці, Z1 Продуктивність праці в енергетиці,Z2 Продуктивність праці в будівництві,Z3 Продуктивність праці в торгівлі,Z4

Продуктивність суспільної праці, Z1

1

 

 

 

Продуктивність суспільної праці, Z1

-0,419179531

1

 

 

Продуктивність праці в будівництві,Z3

-0,306882055

0,653186677

1

 

Продуктивність праці в торгівлі,Z4

0,617489323

-0,577642957

-0,189240772

1

 

rz1, z4 = 0,6174 – максимальний коефіцієнт кореляції.

 

3. Проведемо регресійний аналіз засобами MSExcel.

Для побудови регресійної моделі Y = F(Z2) потрібно виконати команду Сервис ® Анализ данных ® Регрессия. У діалоговому вікніввести:

 

 

 

Y = F(Z2)

ВЫВОД ИТОГОВ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Регрессионная статистика

 

 

 

 

 

 

 

Множественный R

0,41918

 

 

 

 

 

 

 

R-квадрат

0,175711

 

 

 

 

 

 

 

Нормированный R-квадрат

0,107021

 

 

 

 

 

 

 

Стандартная ошибка

0,383613

 

 

 

 

 

 

 

Наблюдения

14

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Дисперсионный анализ

 

 

 

 

 

 

 

 

df

SS

MS

F

Значимость F

 

 

 

Регрессия

1

0,376434

0,3764

2,5580094

0,135719

 

 

 

Остаток

12

1,765909

0,1472

 

 

 

 

 

Итого

13

2,142343

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Коэффициенты Стандартная ошибка t-статистика P-Значение Нижние 95% Верхние 95% Нижние 95,0% Верхние 95,0%
Y-пересечение

1,401804

0,285457

4,9107

0,0003594

0,779848

2,0238

0,78

2,02

Производитель-ность труда в энергетике,Z2

-0,17014

0,106381

-1,599

0,1357189

-0,40193

0,0616

-0,4

0,06

 

Запишемо рівняння регресії: Y = 1,4 – 0,17×Z2

Розрахункове значення               Y = 1,4 – 0,17 × 2,04 = 1,0532

Фактичне значення             Y=0,45

           

Проведемо оцінку значимості моделі за критерієм Фішера.

F - критерій Фішера є параметричним критерієм та використовується для порівняння дисперсій двох варіаційних рядів. Емпіричне значення критерія обчислюється за формулою:

 

де  - більша дисперсія,

- менша дисперсія варіаційних рядів, що розглядаються.

 

Якщо обчислене значення критерію Fемп більше критичного для певного рівня значущості і відповідних чисел ступенів свободи для чисельника і знаменника, то дисперсії вважаються різними. Іншими словами, перевіряється гіпотеза, що полягає у тому, що генеральні дисперсії даних сукупностей рівні між собою: H0={Dx=Dy}.

 

R2=0.17 – це означає, що 17% дисперсії показника Yможна пояснити за допомогою побудови моделі залежності від Z2.

Модель є значимою, якщо Fрозр>Fкрпридовірчій імовірності 0,95.

Fкробчислюється засобами EXCEL статистичною функцією FРАСПОБР(α; m; n-m-1), деn – кількість спостережень,m– кількість факторів.

FРАСПОБР(0,05; 1; 12)=4,75

У нашому випадку Fрозр(2,558)<Fкр(4,75), тобто рівняння є не значимим.

 

4.Аналогічно побудуємо регресійну модель Y = F(Z2, Z3).

 

ВЫВОД ИТОГОВ

       

 

     

Регрессионная статистика

   

 

       
Множественный R

0,729993

   

 

       
R-квадрат

0,532889

   

 

       
Нормированный R-квадрат

0,44796

   

 

       
Стандартная ошибка

0,301619

   

 

       
Наблюдения

14

   

 

       
Дисперсионный анализ

 

   

 

       

df

SS MS

F

Значи-мость F      
Регрессия

2

1,141631 0,570816

6,274508

0,015199      
Остаток

11

1,000712 0,090974        
Итого

13

2,142343  

 

       
 

 

   

 

       

Коэффи-циенты

Стандартная ошибка t-статис-тика

P-Значение

Нижние 95% Верхние 95% Нижние 95,0% Верхние 95,0%
Y-пересечение

0,430732

0,330874 1,301802

0,219586

-0,29752 1,158981 -0,29752 1,158981
Продуктивністьпраці в енергетиці, Z2

0,06286

0,060024 1,047245

0,317453

-0,06925 0,194971 -0,06925 0,194971
Продуктивністьпраці в будівництві, Z3

1,903609

0,53766 3,540541

0,004628

0,720225 3,086992 0,720225 3,086992
                     

Y = 0,5 – 0,038×Z2 + 0,43×Z4

Розрахункове значення   Y = 0,5 – 0,038 × 2,04 + 0,43 × 0,7 = 0,7235  

Фактичне значення          Y=0,45

 

Проведемо оцінку значимості моделі.

R2=0.39 – це означає, що 39% дисперсії показника Yможна пояснити за допомогою побудови моделі залежності від Z2 та Z4.

FРАСПОБР(0,05; 2; 11)=3,98

У нашому випадку Fрозр(6,274508)>Fкр(3,98), тобто рівняння є значимим.

5. Проведемо перевірку значимості впливаючих факторів з використанням критерію Стьюдента.

tрозр>tкр

tкр= СТЬЮДРАСПОБР(a, n-m)

tкр= СТЬЮДРАСПОБР(0,05, 14-2)=2,18

Для показника Z2:tрозр(1,047)<tкр(2,18), тобто показник є не значимим.

Для показника Z3:tрозр(3,54)>tкр(2,18), тобто показник є значимим.

Тобто показник Z2можна вилучити з рівняння та побудувати регресійну модель Y = F(Z3).

ВЫВОД ИТОГОВ

 

 

 

 

 

 

 

Регрессионная статистика

 

 

 

 

 

 

 

Множественный R

0,697364

 

 

 

 

 

 

 

R-квадрат

0,486317

 

 

 

 

 

 

 

Нормированный R-квадрат

0,44351

 

 

 

 

 

 

 

Стандартная ошибка

0,302832

 

 

 

 

 

 

 

Наблюдения

14

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Дисперсионный анализ

 

 

 

 

 

 

df

SS

MS

F

Значимость F

 

 

 

Регрессия

1

1,041858

1,041858

11,36072

0,005564

 

 

 

Остаток

12

1,100485

0,091707

 

 

 

 

 

Итого

13

2,142343

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Коэффи-циенты

Стандартная ошибка

t-статис-тика

P-Значение

Нижние 95%

Верхние 95%

Нижние 95,0%

Верхние 95,0%

Y-пересечение

0,760107

0,103162

7,368108

8,64E-06

0,535337

0,984877

0,535337

0,984877

Продуктивністьпраці в будівництві, Z3

1,754941

0,520666

3,370567

0,005564

0,620506

2,889375

0,620506

2,889375

Y = 0,760107 – 1,754941×Z1

Побудована модель може бути використана для прогнозування даних.

Наприклад, при продуктивності праці в будівництві 2,95 отримуємо значення показника продуктивності суспільної праці.

y=0,760107 – 1,754941×2.95= –4.4169

 


Задание3

Найти оптимальные  значения переменных Х, используя пакет « Excel» инструмент «Поиск решений». Методические указания представлены после заданий по вариантам. Пример  в отдельном файле « Пример задания 3»

 

Вариант1

 

 

 

Вариант2

 

Вариант

 

 

Вариант 4

 

 

Вариант 5

 

Вариант 6

 

 

Вариант7

 

 

 

Вариант8

 

Вариант9

 

 

Вариант10

 

Вариант11

 

Вариант12

 

Вариант13

 

 

Вариант14

 

Вариант15

 

ВирішитиВариантзасобами пакета Excel.

 

Вариант16

 

 

 

Вариант17

 

Вариант18

 

 

Вариант19

 

 

Вариант20

 

Вариант21

 

 

Вариант22

 

 

 

Вариант23

 

Вариант24

 

 


Дата добавления: 2018-04-15; просмотров: 308; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!