Интервальные оценки парных коэффициентов корреляции



Исходные данные

объект

наблюдаемые признаки

X - средняя продолжительность жизни женщин Y - уровень рождаемости (число родившихся на 1000 жителей) Z - уровень смертности (число умерших на 1000 жителей)

Беларусь

76

13

11

Босния

78

14

6

Болгария

75

13

12

Хорватия

77

11

11

Чехия

77

13

11

Эстония

76

14

12

Грузия

76

16

9

Венгрия

76

12

12

Латвия

75

14

10

Литва

77

15

10

Польша

77

14

10

Румыния

75

14

10

Россия

74

13

11

Украина

75

12

13

I . Корреляционный анализ

Постановка задачи

Требуется на основании указанных в приведенной таблице статистических данных для n=14 стран, отобранных случайным образом, исследовать стохастическую зависимость между социальными показателями X, Y, Z, полагая, что их совместное распределение подчинено трехмерному нормальному закону.

К вопросам анализа относятся:

- оценка тесноты связи между произвольными двумя наблюдаемыми признаками при фиксировании или исключении влияния третьего признака;

- оценка тесноты связи каждого из рассматриваемых признаков с совокупностью остальных признаков;

- проверка значимости коэффициентов связи;

- интервальное оценивание коэффициентов связи.

- построение модели корреляционной зависимости между признаками.

Определение точечных оценок параметров совместного распределения признаков. Формирование выборочной корреляционной матрицы

Признаки X, Y, Z образуют трехмерную нормально распределенную генеральную совокупность, которая определяется девятью параметрами:

• тремя математическими ожиданиями MX, MY, MZ;

• тремя дисперсиями DX, DY, DZ;

• тремя парными коэффициентами корреляции ρxy; ρxz; ρyz.

Выборочные средние

Выборочные средние квадратические отклонения

Выборочные парные коэффициенты корреляции

Матрица выборочных парных коэффициентов корреляции

q3=
1

0,108

-0,531

0,108

1

-0,545

-0,531

-0,545

1

 

Исследование парных коэффициентов корреляции

Парный коэффициент корреляции численно характеризует тесноту связи между произвольными двумя признаками, выбранными из совокупности рассматриваемых показателей, на фоне влияния третьего показателя, введенного в корреляционный анализ.

Проверка значимости парных коэффициентов корреляции

(при уровне значимости применяемого статистического критерия α=0,05)

Проверяемые гипотезы:

H0: ρxy=0 H0: ρxz=0 H0: ρyz=0

Наблюдаемые значения статистики критерия:

Нахождение tкр - граничного значения области отвержения гипотезы

Способы:

Ø или из статистической таблицы 2 (Значения функции , где случайная величина Т распределена по закону Стьюдента с числом степеней свободы, равным ν) на основании уравнения:

,

Ø или с помощью статистической функции Microsoft Excel СТЬЮДРАСПОБР(вероятность;степени_свободы):

tкр=СТЬЮДРАСПОБР(α;n -2).

В данном случае

tкр= 2,1788.

Условие отвержения гипотезы
 о незначимости коэффициента корреляции

.

Результаты проверки гипотез:

v гипотеза  H0: ρxy=0 не отвергается, парный коэффициент корреляции между X и Y не значим;

v гипотеза H0: ρxz=0 не отвергается, парный коэффициент корреляции между X и Z не значим;

v гипотеза H0: ρyz=0 отвергается, парный коэффициент корреляции между Y и Z значим.

Вывод

Между признаками Y, Z существует значимая обратная умеренная корреляционная зависимость.

Интервальные оценки парных коэффициентов корреляции

(с надежностью доверительных интервалов γ=0,95)

Построение доверительных интервалов производится, как правило, для значимых парных коэффициентов корреляции по следующей схеме.

► Прямое преобразование Фишера - арктангенс гиперболический -
выборочных парных коэффициентов корреляции

Способы:

Ø или с помощью статистической таблицы 6 (Z -преобразования Фишера),

Ø или используя статистическую функцию Microsoft Excel ФИШЕР (x), где x - числовое значение, которое требуется преобразовать.

Для исходной выборки

arcth(rxy)= 0,1084 arcth(rxz)= -0,5919 arcth(ryz)= -0,6109

► Определение tγ - квантили уровня (1+γ)/2 распределения Ν(0,1)

Способы:

Ø или из статистической таблицы 1 (Значения функции Лапласа , где Т имеет стандартное нормальное распределение), исходя из соотношения:

,

Ø или с помощью статистической функции Microsoft Excel НОРМСТОБР(вероятность), определяющей по уровню (1+γ)/2 значение соответствующей квантили:

tγ = НОРМСТОБР((1+γ)/2).

Для заданной надежностиtγ = 1,96.

► Нахождение границ доверительных интервалов для математических ожиданий
arcth(rxy), arcth(rxz), arcth(ryz)

Отправное неравенство: .

Результаты вычислений сведены в таблицу:

 
rxy -0,4825 0,6994
rxz -1,1828 -0,0009
ryz -1,2019 -0,0200

► Установление границ доверительных интервалов для парных коэффициентов корреляции ρxy, ρxz, ρyz - обратное преобразование Фишера границ доверительных интервалов для M{arcth(rxy)} , M{arcth(rxz)} , M{arcth(ryz)}

Способы:

Ø или с помощью статистической таблицы 6 (Z -преобразования Фишера),

Ø или используя статистическую функцию Microsoft Excel ФИШЕРОБР(y), где y - значение, для которого совершается обратное преобразование.

Отправное неравенство: .

Отсюда

th(-0,4825)=-0,448 < ρ xy <0,604 =th(0,6994);

th(-1,1828)=-0,828 < ρ xz <-0,001=th(-0,0009);

th(-1,2019)=-0,834 < ρ yz <-0,020=th(-0,0200).

Вывод

Доверительный интервал для парного коэффициента корреляции ρyz не содержит нуля, что подтверждает значимость данного коэффициента.


Дата добавления: 2023-01-08; просмотров: 121; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!