Тема 5. Корреляционный анализ



 

В результате изучения темы студент должен:

знать

- формы (виды) связей между процессами и явлениями в природе и обществе;

-сущность корреляционной связи, её виды по направлению и силе;

- методику вычисления коэффициента корреляции по методу квадратов (Пирсона) и рангов (Спирмена), ошибки и достоверности коэффициентов корреляции;

уметь

- рассчитать коэффициент корреляции по методу квадратов (Пирсона);

- рассчитать коэффициент корреляции по методу рангов (Спирмена);

- определить направление и силу корреляционной связи;

- рассчитать ошибку и достоверность коэффициента корреляции.

 

Контрольные вопросы

1. Какие формы (виды) связей между процессами и явлениями существуют в природе и обществе?

2.Что такое функциональная связь, и для каких явлений она характерна?

3. Что такое корреляционная связь, и для каких явлений она характерна?

4. Что понимается под прямой и обратной корреляционной связью?

5. Каким образом оценивается сила корреляционной связи между явлениями?

6. Какие существуют методы вычисления коэффициента корреляции?

 

Логическая структура темы: Корреляционный анализ (приложение 7).

Задача-эталон

Исходные данные

Таблица 1

Температура тела и частота пульса

   
t° тела (x) Частота пульса (y)
36 60
36 65
36 70
38 80
40 90
40 100

Задание

На основании исходных данных:

1) рассчитать коэффициент корреляции по методу квадратов (Пирсона) и методу рангов (Спирмена);

2) определить направление и силу связи;

3) рассчитать ошибку коэффициента корреляции;

4) рассчитать достоверность коэффициента корреляции.

Решение

Метод квадратов (Пирсона)

Таблица 2

 

t° тела (x) Частота пульса (y) dx dy dx´dy dx2 dy2
1. 2. 3. 4. 5. 6. 7.
36 60 –1,7 –17,5 29,75 2,89 306,25
36 65 –1,7 –12,5 21,25 2,89 156,25
36 70 –1,7 –7,5 12,75 2,89 56,25
38 80 +0,3 +2,5 0,75 0,09 6,25
40 90 +2,3 +12,5 28,75 5,29 156,25
40 100 +2,3 +22,5 51,75 5,29 506,25
Sx = 226 Mx=37,67 Sy = 465 My=77,5     S = 145,0 S = 19,34 S = 1187,5

 

1) определяем средние величины (средние арифметические) для двух вариационных рядов (температуры тела и частоты пульса) – графы 1 и 2:

                226                            465

Mx = ------- = 37,7     My = ------- = 77,5                     

                    6                                     6

2) находим d – отклонение каждой варианты от средней величины для ряда x (dx = x – Mx) и для ряда y (dy = y – My). Полученные результаты заносим в таблицу 2 (графы 3 и 4).

3) вычисляем произведение отклонений каждой варианты от средней величины (dx ´ dy) и его суммируем ( Sdx´dy ); полученные результаты заносим в таблицу 2 (графа 5).

4) каждое отклонение (dx и dy) возводим в квадрат и суммируем по ряду x – Sdx2 и по ряду y – Sdy2. Полученные результаты заносим в таблицу (графы 6 и 7).

5) рассчитываем коэффициент корреляции (rxy) по формуле:

                    Sdх х dy

       rxy = ------------------,    подставив в неё полученные результаты из таблицы 2:

               Ö ådx2 x ådy2

 

                   å dxxdy                       145,0            145,03       145,03 

rxy  = ----------------- = ---------------------- = ------------- = ------------ = +0,96

                Öådx2xådy2   Ö19,34 х 1187,5 Ö22966,25  151,55

 

6) рассчитываем ошибку коэффициента корреляции (mrxy) по формуле:

 

                     1- rxy2  1 – 0,962    1 – 0,92   0,08

mrxy = ±---------- = ------------ = ------------ = -------- = ± 0,04                 

                    √ n – 1   √ 6 – 1      √ 5       2,24

 

7) рассчитываем достоверность коэффициента корреляции (t) по формуле:

              rxy      0,96   

t = ------ = --------- = 24,0          

              mr       0,04

Вывод

Между температурой тела и частотой пульса существует прямая и сильная корреляционная связь, так как коэффициент корреляции равен +0,96. Коэффициент корреляции достоверен (р > 99 %), так как утроенная ошибка, равная ±0,04, меньше коэффициента корреляции.*

 

*С достаточной для медико-социальных исследований надежностью о наличии той или иной степени связи можно утверждать только тогда, когда величина коэффициента корреляции превышает или равняется величине трёх своих ошибок (r xy ³ 3mr).

 

Метод рангов (Спирмена)

Таблица 3

 

to тела (х)

Частота пульса (у)

Порядковый номер – ранги

Разность рангов (d)

 

d2

х у
1. 2. 3. 4. 5. 6.
36 60 2 1 +1 1
36 65 2 2 0 0
36 70 2 3 -1 1
38 80 4 4 0 0
40 90 5,5 5 +0,5 0,25
40 100 5,5 6 -0,5 0,25
          å = 2,5

 

1. Для рассчёта коэффициента методом рангов определяем порядковый номер (ранг) вариант, который cоответствует каждому значению температуры тела и частоты пульса (таблица 3).

При обозначении ранга (порядкового номера) варианты, ранжировать начинают с её меньшего значения в обоих рядах (графы 3 и 4).

Если варианты имеют одинаковое значение (температура тела 36o и 40o), то ранги распределяются следующим образом: температура тела 36o встречается трижды, занимая 1-е, 2-е и 3-е места, следовательно, порядковые номера в этом случае будут равны средней арифметической, занимаемых этими значениями температуры мест (1+2+3) / 3 = 2, т.е. против каждого показателя температуры 36o будет проставлен ранг 2. Для температуры тела 38о ранг равен – 4. Ранги для температуры тела 40o будут равны (5+6) / 2 = 5,5.

 

2. Определяем разность между рангами (d) по каждой строке – графа 5, возводим её в квадрат (d2) и находим сумму (å) – графа 6.

 

3. Коэффициент ранговой корреляции определяем по формуле:

                     6 х åd2

rху = 1 – ----------- , подставив в неё полученные результаты из таблицы 3:       

                    n(n2–1)     

          

                       6 х 2,5            15              15

rху= 1 – ----------- = 1 – ----------- = 1 – --------- = 1 – 0,07 = +0,93

                6(62- 1)        6(36-1)          210

 

4. Рассчитываем ошибку коэффициента корреляции (mrху) по формуле:

                        1-rху2          1 – 0,931 – 0,86    0,14      0,14

 mrху = ±  --------- = ±  ------------ = ----------- = --------- = ----------- = ± 0,063

                       √ n – 1      √6 – 1       √ 5         √ 5       2,24

5. Рассчитываем достоверность коэффициента корреляции (t) по формуле:

               rxy      0,93

t = ------ = --------- = 14,8

mrху 0,063     

 

Вывод

Коэффициент корреляции равный + 0,93 позволяет заключить о наличии прямой и сильной связи между температурой тела и частотой пульса. Утроенная ошибка, равная ± 0,063 меньше коэффициента корреляции, следовательно коэффициент корреляции достоверен (р > 99%).

 


Дата добавления: 2022-01-22; просмотров: 18; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!