Интервальные оценки парных коэффициентов корреляции
Исходные данные
объект | наблюдаемые признаки | ||
X - средняя продолжительность жизни женщин | Y - уровень рождаемости (число родившихся на 1000 жителей) | Z - уровень смертности (число умерших на 1000 жителей) | |
Беларусь | 76 | 13 | 11 |
Босния | 78 | 14 | 6 |
Болгария | 75 | 13 | 12 |
Хорватия | 77 | 11 | 11 |
Чехия | 77 | 13 | 11 |
Эстония | 76 | 14 | 12 |
Грузия | 76 | 16 | 9 |
Венгрия | 76 | 12 | 12 |
Латвия | 75 | 14 | 10 |
Литва | 77 | 15 | 10 |
Польша | 77 | 14 | 10 |
Румыния | 75 | 14 | 10 |
Россия | 74 | 13 | 11 |
Украина | 75 | 12 | 13 |
I . Корреляционный анализ
Постановка задачи
Требуется на основании указанных в приведенной таблице статистических данных для n=14 стран, отобранных случайным образом, исследовать стохастическую зависимость между социальными показателями X, Y, Z, полагая, что их совместное распределение подчинено трехмерному нормальному закону.
К вопросам анализа относятся:
- оценка тесноты связи между произвольными двумя наблюдаемыми признаками при фиксировании или исключении влияния третьего признака;
- оценка тесноты связи каждого из рассматриваемых признаков с совокупностью остальных признаков;
- проверка значимости коэффициентов связи;
- интервальное оценивание коэффициентов связи.
- построение модели корреляционной зависимости между признаками.
Определение точечных оценок параметров совместного распределения признаков. Формирование выборочной корреляционной матрицы
|
|
Признаки X, Y, Z образуют трехмерную нормально распределенную генеральную совокупность, которая определяется девятью параметрами:
• тремя математическими ожиданиями MX, MY, MZ;
• тремя дисперсиями DX, DY, DZ;
• тремя парными коэффициентами корреляции ρxy; ρxz; ρyz.
Выборочные средние
Выборочные средние квадратические отклонения
Выборочные парные коэффициенты корреляции
Матрица выборочных парных коэффициентов корреляции
q3= |
|
Исследование парных коэффициентов корреляции
Парный коэффициент корреляции численно характеризует тесноту связи между произвольными двумя признаками, выбранными из совокупности рассматриваемых показателей, на фоне влияния третьего показателя, введенного в корреляционный анализ.
Проверка значимости парных коэффициентов корреляции
(при уровне значимости применяемого статистического критерия α=0,05)
Проверяемые гипотезы:
H0: ρxy=0 | H0: ρxz=0 | H0: ρyz=0 |
Наблюдаемые значения статистики критерия:
Нахождение tкр - граничного значения области отвержения гипотезы
|
|
Способы:
Ø или из статистической таблицы 2 (Значения функции , где случайная величина Т распределена по закону Стьюдента с числом степеней свободы, равным ν) на основании уравнения:
,
Ø или с помощью статистической функции Microsoft Excel СТЬЮДРАСПОБР(вероятность;степени_свободы):
tкр=СТЬЮДРАСПОБР(α;n -2).
В данном случае
tкр= 2,1788.
Условие отвержения гипотезы
о незначимости коэффициента корреляции
.
Результаты проверки гипотез:
v гипотеза H0: ρxy=0 не отвергается, парный коэффициент корреляции между X и Y не значим;
v гипотеза H0: ρxz=0 не отвергается, парный коэффициент корреляции между X и Z не значим;
v гипотеза H0: ρyz=0 отвергается, парный коэффициент корреляции между Y и Z значим.
Вывод
Между признаками Y, Z существует значимая обратная умеренная корреляционная зависимость.
Интервальные оценки парных коэффициентов корреляции
(с надежностью доверительных интервалов γ=0,95)
Построение доверительных интервалов производится, как правило, для значимых парных коэффициентов корреляции по следующей схеме.
► Прямое преобразование Фишера - арктангенс гиперболический -
выборочных парных коэффициентов корреляции
|
|
Способы:
Ø или с помощью статистической таблицы 6 (Z -преобразования Фишера),
Ø или используя статистическую функцию Microsoft Excel ФИШЕР (x), где x - числовое значение, которое требуется преобразовать.
Для исходной выборки
arcth(rxy)= 0,1084 | arcth(rxz)= -0,5919 | arcth(ryz)= -0,6109 |
► Определение tγ - квантили уровня (1+γ)/2 распределения Ν(0,1)
Способы:
Ø или из статистической таблицы 1 (Значения функции Лапласа , где Т имеет стандартное нормальное распределение), исходя из соотношения:
,
Ø или с помощью статистической функции Microsoft Excel НОРМСТОБР(вероятность), определяющей по уровню (1+γ)/2 значение соответствующей квантили:
tγ = НОРМСТОБР((1+γ)/2).
Для заданной надежностиtγ = 1,96.
► Нахождение границ доверительных интервалов для математических ожиданий
arcth(rxy), arcth(rxz), arcth(ryz)
Отправное неравенство: .
Результаты вычислений сведены в таблицу:
rxy | -0,4825 | 0,6994 |
rxz | -1,1828 | -0,0009 |
ryz | -1,2019 | -0,0200 |
► Установление границ доверительных интервалов для парных коэффициентов корреляции ρxy, ρxz, ρyz - обратное преобразование Фишера границ доверительных интервалов для M{arcth(rxy)} , M{arcth(rxz)} , M{arcth(ryz)}
Способы:
Ø или с помощью статистической таблицы 6 (Z -преобразования Фишера),
|
|
Ø или используя статистическую функцию Microsoft Excel ФИШЕРОБР(y), где y - значение, для которого совершается обратное преобразование.
Отправное неравенство: .
Отсюда
th(-0,4825)=-0,448 < ρ xy <0,604 =th(0,6994);
th(-1,1828)=-0,828 < ρ xz <-0,001=th(-0,0009);
th(-1,2019)=-0,834 < ρ yz <-0,020=th(-0,0200).
Вывод
Доверительный интервал для парного коэффициента корреляции ρyz не содержит нуля, что подтверждает значимость данного коэффициента.
Дата добавления: 2023-01-08; просмотров: 121; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!