Коэффициент множественной корреляции



Он принимает значения от 0 до 1 (в отличии от парного коэффициента корреляции, который может принимать отрицательные значения). Поэтому R не может быть использован для интерпретации направления связи. Чем плотнее фактические значения yi располагаются относительно линии регрессии, тем меньше остаточная дисперсия и, следовательно, больше величина Ry(x1,...,xm). Таким образом, при значении R близком 1, уравнение регрессии лучше описывает фактические данные и факторы сильнее влияют на результат. При значении R близком к 0 уравнение регрессии плохо описывает фактические данные и факторы оказывают слабое воздействие на результат.

Оценка значимости полученного уравнения множественной регрессии.

Оценка значимости уравнения множественной регрессии осуществляется путем проверки гипотезы о равенстве нулю коэффициент детерминации рассчитанного по данным генеральной совокупности:

Или

b1=b2=…=bm=0

(гипотеза о незначимости уравнения регрессии, рассчитанного по данным генеральной совокупности).

Для ее проверки используют F-критерий Фишера.

При этом вычисляют фактическое (наблюдаемое) значение F-критерия, через коэффициент детерминации R2y(x1,...,xm), рассчитанный по данным конкретного наблюдения:

 

 

 где n-число наблюдений; h – число оцениваемых параметров (в случае двухфакторной линейной регрессии h=3).

По таблицам распределения Фишера-Снедоккора находят критическое значение F-критерия (Fкр). Для этого задаются уровнем значимости a (обычно его берут равным 0,05) и двумя числами степеней свободы k1=h-1 и k2=n-h.

Сравнивают фактическое значение F-критерия (Fнабл) с табличным Fкр(a;k1;k2). Если Fнабл<Fкр(a;k1;k2), то гипотезу о незначимости уравнения регрессии не отвергают. Если Fнабл>Fкр(a;k1;k2), то выдвинутую гипотезу отвергают и принимают альтернативную гипотезу о статистической значимости уравнения регрессии.

 

РАСЧЕТНАЯ ЧАСТЬ

 

Y – приток нефти; X1 – забойное давление; X2 – насыщенность породы нефтью. Составим вспомогательную таблицу:

y

x1

x2

1

8,8

5,7

11,8

2

8,8

5,7

15,8

3

8,8

5,5

16,8

4

8,8

5,8

17,8

5

8,8

5,6

18,8

6

8,8

6,6

20,8

7

9,8

7,2

20,8

8

9,8

6,2

21,8

9

9,8

7,1

21,8

10

11,8

8,6

21,8

11

10,8

7,8

22,8

12

12,8

8,2

23,8

13

10,8

8,6

23,8

14

12,8

9

26,8

15

13,8

9,8

29,8

16

13,8

10

30,8

17

13,8

9,9

31,8

18

13,8

10,3

32,8

19

15,8

11,4

33,8

20

15,8

10,8

37,8

21

8,8

5,7

11,8

22

8,8

5,7

15,8

23

8,8

5,5

16,8

24

8,8

5,8

17,8

25

8,8

5,6

18,8

26

8,8

6,6

20,8

27

9,8

7,2

20,8

28

9,8

6,2

21,8

29

9,8

7,1

21,8

30

11,8

8,6

21,8

31

10,8

7,8

22,8

32

12,8

8,2

23,8

33

10,8

8,6

23,8

34

12,8

9

26,8

35

13,8

9,8

29,8

36

13,8

10

30,8

37

13,8

9,9

31,8

38

13,8

10,3

32,8

39

15,8

11,4

33,8

40

15,8

10,8

37,8

 

y

x1

x2

y*x1

y*x2

x1*x2

x12

x22

y2

1

8,8

5,7

11,8

50,16

103,84

67,26

32,49

139,24

77,44

2

8,8

5,7

15,8

50,16

139,04

90,06

32,49

249,64

77,44

3

8,8

5,5

16,8

48,4

147,84

92,4

30,25

282,24

77,44

4

8,8

5,8

17,8

51,04

156,64

103,24

33,64

316,84

77,44

5

8,8

5,6

18,8

49,28

165,44

105,28

31,36

353,44

77,44

6

8,8

6,6

20,8

58,08

183,04

137,28

43,56

432,64

77,44

7

9,8

7,2

20,8

70,56

203,84

149,76

51,84

432,64

96,04

8

9,8

6,2

21,8

60,76

213,64

135,16

38,44

475,24

96,04

9

9,8

7,1

21,8

69,58

213,64

154,78

50,41

475,24

96,04

10

11,8

8,6

21,8

101,48

257,24

187,48

73,96

475,24

139,24

11

10,8

7,8

22,8

84,24

246,24

177,84

60,84

519,84

116,64

12

12,8

8,2

23,8

104,96

304,64

195,16

67,24

566,44

163,84

13

10,8

8,6

23,8

92,88

257,04

204,68

73,96

566,44

116,64

14

12,8

9

26,8

115,2

343,04

241,2

81

718,24

163,84

15

13,8

9,8

29,8

135,24

411,24

292,04

96,04

888,04

190,44

16

13,8

10

30,8

138

425,04

308

100

948,64

190,44

17

13,8

9,9

31,8

136,62

438,84

314,82

98,01

1011,24

190,44

18

13,8

10,3

32,8

142,14

452,64

337,84

106,09

1075,84

190,44

19

15,8

11,4

33,8

180,12

534,04

385,32

129,96

1142,44

249,64

20

15,8

10,8

37,8

170,64

597,24

408,24

116,64

1428,84

249,64

21

8,8

5,7

11,8

50,16

103,84

67,26

32,49

139,24

77,44

22

8,8

5,7

15,8

50,16

139,04

90,06

32,49

249,64

77,44

23

8,8

5,5

16,8

48,4

147,84

92,4

30,25

282,24

77,44

24

8,8

5,8

17,8

51,04

156,64

103,24

33,64

316,84

77,44

25

8,8

5,6

18,8

49,28

165,44

105,28

31,36

353,44

77,44

26

8,8

6,6

20,8

58,08

183,04

137,28

43,56

432,64

77,44

27

9,8

7,2

20,8

70,56

203,84

149,76

51,84

432,64

96,04

28

9,8

6,2

21,8

60,76

213,64

135,16

38,44

475,24

96,04

29

9,8

7,1

21,8

69,58

213,64

154,78

50,41

475,24

96,04

30

11,8

8,6

21,8

101,48

257,24

187,48

73,96

475,24

139,24

31

10,8

7,8

22,8

84,24

246,24

177,84

60,84

519,84

116,64

32

12,8

8,2

23,8

104,96

304,64

195,16

67,24

566,44

163,84

33

10,8

8,6

23,8

92,88

257,04

204,68

73,96

566,44

116,64

34

12,8

9

26,8

115,2

343,04

241,2

81

718,24

163,84

35

13,8

9,8

29,8

135,24

411,24

292,04

96,04

888,04

190,44

36

13,8

10

30,8

138

425,04

308

100

948,64

190,44

37

13,8

9,9

31,8

136,62

438,84

314,82

98,01

1011,24

190,44

38

13,8

10,3

32,8

142,14

452,64

337,84

106,09

1075,84

190,44

39

15,8

11,4

33,8

180,12

534,04

385,32

129,96

1142,44

249,64

40

15,8

10,8

37,8

170,64

597,24

408,24

116,64

1428,84

249,64

Построим линейную модель множественной репрессии, запишем стандартизированное уравнение множественной репрессии, на основе стандартизированных коэффициентов эластичности ранжируем факторы:

Составим вспомогательную таблицу для расчетов параметров уравнения линейной репрессии:

 

∑ y

∑ x1

∑ x2

∑ y*x1

∑ y*x2

∑ x1*x2

∑ x12

∑ x22

∑ y2

456

319,6

964

3819,08

11588,4

8175,68

2696,44

24996,8

5428

2

2

2

11,4

7,99

24,1

95,477

289,71

204,392

67,411

624,92

135,7

 

Найдем среднее квадратические отклонения признаков:

;

;

;

 

Линейная многофакторная регрессия:

;

 

Рассчитаем парные коэффициенты корреляции:

;

;

;

;

;

;

 .

 

Составим стандартизированное уравнение регрессии:

;

Найдем 𝛽1 и 𝛽2 по следующим формулам:

;

;

;

;

Уравнения в стандартизированном виде имеет вид:

;

Так как в стандартизированном уравнении регрессии можно сравнивать между собой, то можно сделать вывод, что забойное давление называет больше влияния на приток нефти, что параметры насыщенности породы нефти.

Линейное уравнение множественной регрессии, стандартизированное уравнение множественной регрессии.

Оценка влияния факторов на результат на основе коэффициентов эластичности, коэффициентов парной корреляции, коэффициента множественной корреляции.

 Сравним влияние факторов на результат с помощью средних коэффициентов жесткости:

 ;

 ;

 ;

 ;

 ;

Увеличение фактора x1 (забойного давления) на 1% дает увеличение результата у на 0.676, а увеличение второго фактора x2 на 1% дает 0.175, таким образом, подтверждаются большие влияния на результат у фактора x1 чем фактора x2.

Найдем коэффициенты парной корреляции и частные коэффициенты корреляции:

 

;

;

.

Они указывают на весьма сильную связь каждого фактора на результат, а так же высокую межфакторную зависимость  .

Частные коэффициенты корреляции характеризует тесную связь между результатом и соответствующим факторам, при элеменировании (устранение влияния) других факторов включенных в уравнение регрессии. При двух факторов частных коэффициенты корреляции рассчитываются следующим образом:

 ;

 ;

 ;

 ;

Коэффициент множественной корреляции определим через матрицу парных кареляций:

;

Где  – определитель матрицы парных коэффициентов корреляции;

 – определитель матрицы межфакторной корреляции;

;

;

Коэффициент множественной корреляции:

;

Аналогичный результат получил при использовании других формул:

 ;

 ;

 ;

;

 

Коэффициент множителя корреляций показываем на весьма сильную связь набора фактов с результатом.

n=40, m=2.

;

;

Оценку надежности уравнения регрессии в целом и показателя тесноты связи  дает F-критерия Фишера:

;

В нашем случае фактическое значение -критерия Фишера:

;

Получили, что . (при n=40), т.е. вероятность случайно получить такое значение F-критерия не превышает допустимый уровень значимости 5%. Следовательно, полученное значение не случайно, оно сформировалось под влиянием существенных факторов, т.е. подтверждается статистическая значимость всего уравнения и показателя тесноты связи.

С помощью частных F-критерия Фишера оценим целесообразность включение в уравнение множественной регрессии фактора х1 после х2 и фактора х2 после х1 при помощи формул:

;

.

 

Найдем  и :

 

;

;

 

Имеем:

 

;

.

ЗАКЛЮЧЕНИЕ

Данная курсовая работа посвящена моделированию технических процессов и систем на основе множественной регрессии. Для достижения этой цели была построена линейная модель множественной регрессии. На основе многофакторного регрессивного анализа и средних коэффициентов эластичности ранжировали факторы по степени их влияния на результат.

Также были найдены и проанализированы коэффициенты парной, частной и множественной корреляции.

С помощью коэффициентов детерминации проведена оценка существенного влияния факторов на результат.

 


Дата добавления: 2018-05-09; просмотров: 232; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!