Определение уравненийрегрессии



Корреляционную зависимость между переменными X и Y можно выра- зить с помощью уравнений типа


 

 

Y = F(x)


или


 

 

Xy = F(Y) ,


 

                    


которые называются уравнениями регрессии. В этих уравнениях

ляются средними арифметическими переменных X и Y.


Yxи Xyяв-


Графическое выражение регрессионного уравнения называют линией регрессии. Линия регрессии выражает наилучшее предсказание зависимой переменной Y по независимым переменным X (рис. 2.17). Эти независимые переменные в математике называются предикатами.

xy = в0 + в1y
O
B yx = ao + a1x
у

 

y

 

A

 

x                                    X

Рис. 2. 17. Линия регрессии У = F(x) и X = F(у)

в системе прямоугольных координат

В соответствии с уравнениями (1) корреляционную зависимость можно выразить с помощью двух уравнений регрессии, которые в самом простом случае выглядят как уравнения прямой:

Y = a0 +a1X,                                                 (2.10)

X = b1 +b1Y.                                                (2.11)

В уравнении (2.10) Y – зависимая переменная, а X – независимая пере- менная, a0 – свободный член, a1 – коэффициент регрессии, или угловой коэф- фициент, определяющий наклон линии регрессии по отношению к осям ко- ординат.

В уравнении (2.11) наоборот X – зависимая переменная, а Y – независи- мая, b0 – свободный член, b1 – коэффициент регрессии, или угловой коэффи- циент, определяющий наклон линии регрессии по отношению к осям коор- динат.

Если произвольно на рис. 2.17 изобразить линии регрессии по уравнени- ям (2.10) и (2.11), то они пересекаются в точке O(x,y) с координатами, соот- ветствующими средним арифметическим значений переменных X и Y. Линия AB, проходящая через точку O, соответствует линейной функциональной за- висимости между переменными Y и X, когда коэффициент корреляции меж- ду ними rxy равен единице. При этом наблюдается следующая закономер- ность: чем сильнее связь между X и Y, тем ближе обе линии регрессии к прямой АВ, и наоборот, чем слабее корреляция, тем больше линии регрессии отклоняются от прямой АВ. При отсутствии связи (rxy =0) между X и Y ли- нии регрессии оказываются под прямым углом по отношению друг к другу.


Количественное установление связи (зависимости) между X и Y (или между Y и X) называется регрессионным анализом.Главная задача регрес- сионного анализа состоит:

- в определение коэффициентов a0, b0, a1,b1,

- вопределениеуровнязначимостиполученныхуравненийрегрессии

(2.10) и (2.11), связывающих между собой переменные X и Y.

Если до проведения регрессионного анализа выполнен корреляционный анализ переменных и определены коэффициенты корреляции между ними, то легко определить коэффициенты регрессии a1 и b1 по формулам:


a1 = rxy


×Sy ,

S


 

b1 = ryx


x

× Sx,

S


y

где Sx, Sy – среднеквадратические отклонения, подсчитанные для пере- менных X и Y соответственно.

å å
(y - y)
2
i       
(x - x)
2
i
Можно рассчитать коэффициенты регрессии и без подсчета среднеквад- ратических отклонений по формулам:

 


a1 =rxy×


,                                                            (2.12)


 

 


å å
(x - x)
2
i      
(y - y)
2
i
b1 =ryx


.                                     (2.13)


 


В том случае, если коэффициент корреляции неизвестен, коэффициенты регрессии можно вычислить по следующим формулам:

a=å(xi-x)×(yi-y).                                              (2.14)

 


i
1             å(x -x)

b=å(xi-x)×(yi-y).                                              (2.15)

 

1
1            å(y-y)

Зная коэффициенты регрессии, можно легко получить коэффициент кор- реляции:


rxy=


a1 ×b1 .


(2.16)


i
i
Свободные члены уравнений регрессии a0 и b0 вычисляются по следую- щим формулам:


a

i
i
=åyi


×åx2 -åx


× åxi


×yi.                       (2.17)


 

 

i
i
0                   åx 2 -å(x)2


i
i
b=åxi


×åy2-åy


× åxi


× yi.


 

 

0                   åy2-å(y)2


Трудоемкость вычислений по формулам (2.14),(2.15),(2.16),(2.17) сво- бодных членов и коэффициентов регрессии достаточно велика, поэтому в регрессионном анализе используются более простые методы их определения, базирующиеся на методе наименьших квадратов [3].

Применяя этот метод для линейной функции зависимости переменных, получим две системы уравнений, позволяющие определить из одной систе- мы величины a0 и a1:

aN+a1Σxi=Σyi,                                        (2.18)

a0 ·Σxi + a1 Σ(xi·xi) = Σyxi ,

а из другой системы величины b0 и b1:

b0·N + bΣyi = Σxi, bΣyi+b1·Σ(yi·yi)=Σyi·xi,

где N – число переменных x или y.

Приведем примервычисления коэффициентов линейной регрессии.

Допустим, что при исследовании статистической зависимости между объемом снятого в процессе токарной обработки материала заготовки Q и глубиной резания s получены следующие результаты эксперимента (табл.2.11):

Таблица 2.11

Номер эксперимента Глубина резания s, мм Объем материала Q, куб. см
1 2,2 2,70
2 2,4 3,15
3 2,6 3,44
4 2,8 3,52
5 3,0 4,05
6 3,2 4,12
7 3,4 4,54
8 3,6 4,61
9 3,8 4,80
10 4,0 5,31
11 4,2 5,53
12 4,4 5,66

Графическое отражение экспериментальных данных приведено                          на рис.2.18.

Уравнение регрессии при этом имеет вид

Y = a0+aX,

где в качестве независимой переменной X выступает глубина резания s, а в качестве зависимой переменной Y выступает объем снятого материала Q.


Q, см3

 


 

6 5 4 3 2 1
a
0

2 2,2 2,4 2,6 2,8 3 3,2 3,4 3,63,8 4    4,2


 

s, мм


Рис. 2.18. Экспериментальная зависимость сошлифованного материала Q

от глубины резания s; а – линия регрессии Q = f (s)

Для решения уравнений (2.18) заполним вспомогательную таблицу 2.12:

 

Таблица 2.12

Номер экс- перимента X X·X Y Y·Y X·Y
1 2,2 4,84 2,70 7,29 5,94
2 2,4 5,76 3,15 9,92 7,56
3 2,6 6,76 3,44 11,83 8,94
4 2,8 7,84 3,52 12,39 9,86
5 3,0 9,00 4,05 16,40 12,15
6 3,2 10,24 4,12 16,97 13,18
7 3,4 11,56 4,54 20,61 15,44
8 3,6 12,96 4,61 21,25 16,60
9 3,8 14,44 4,80 23,04 18,24
10 4,0 16,00 5,31 28,20 21,24
11 4,2 17,64 5,53 30,58 23,23
12 4,4 19,36 5,66 32,04 24,90
Σ 39,60 136,40 51,43 230,52 177,28

Подставляя значения данных табл.2.12 в уравнение (2.18), получим сле- дующую систему линейных уравнений:

a0 ·12 + a1·39,60 = 51,43, a0×39,60 + a1·136,40 =177,28.

Решая эту систему уравнений, получим a0= -0,44 ; a1= 1,40.Тогда

Y = -0,44+ 1,40·X..

Для решения уравнения регрессии

X = b0 + bY

получим следующую систему уравнений:

b0 12 + b1·51,43 = 39,60,


b0 ·51,43 + b1·230,52 = 177,28.

Решая эту систему уравнений, получим b0 = 0,30; b1 = 0,70. Тогда

X = 0,30 + 0,70·Y.

 


Дата добавления: 2018-02-15; просмотров: 189;