Проверить независимость двух характеристик по критерию сопряженности хи-квадрат



Постановка задачи.

 

По выборке  из двумерного распределения (не обязательно нормального) проверить гипотезу независимости компонентов наблюдаемого случайного вектора .

 

Теоретические основы.

См. стр. 59-62 и стр. 63-65 пособия [4].

 

Вычисления.

При построении критерия сопряженности для данных непрерывного типа основная сложность состоит в получении таблицы сопряженности. Если объем выборки не слишком велик (< 200), то наиболее простой способ – воспользоваться помощью одного из друзей и, перебирая все пары данных от первой до последней, установить принадлежность их той или иной ячейке. Процесс можно организовать следующим образом. Один из студентов произносит вслух пару чисел , а второй студент ставит точку в ту ячейку, куда попала эта пара. По окончании перебора всех чисел останется только подсчитать количество точек в каждой из ячеек.

Пример.

Рассмотрим сначала задачу исследования зависимости между характеристиками по данным, представленным в виде таблицы сопряженности. В качестве примера взяты данные медицинского обследования абитуриентов одного из вузов г. Казани на предмет зависимости артериального давления (первый признак) от уровня употребления табачных изделий (второй признак). Данные обследования занесены в ячейки B2:E3 приведенной ниже таблицы.


 

  A B C D E F G H I J K
1 Курение Давление Много Умеренно Мало Не курят Σ  

Таблица квадратов

расхождений

2 Высокое 81 69 116 76 342   2,15 0,25 0,41 0,97
3 Норма 80 83 172 123 458   1,61 0,19 0,31 0,72
4 Σ 161 152 288 199 800       X 2 = 6,6
5                   0,08
6     Вывод

Прослеживается слабо значимая тенденция к увеличению давления

     

 

 

a  Порядок вычислений.

1) Подсчитать общее количество случаев по каждой группе каждого из признаков и общее количество случаев

Ø выделить блок ячеек B2:F4

– исходная таблица данных плюс пустая строка ниже и пустой столбец справа;

Ø нажать кнопку  на панели инструментов.

 

Составить таблицу квадратов расхождений:

 

2) в ячейку H2 ввести формулу

Ø =($F$4*B2-B$4*$F2)^2/($F$4*B$4*$F2)

{  – это просто пояснение }

– следите за правильностью расположения знаков $;

3) скопировать ячейку H2 во все ячейки блока H2:K3;

4) вычислить статистику хи-квадрат в ячейке K4

=СУММ(H2:K3)

5) вычислить критический уровень значимости в ячейке K5

=ХИ2РАСП(K4;(2-1)*(4-1))

– здесь цифра “2” – это число групп по признаку «Давление», а цифра “4” – число групп по признаку «Курение»;

6) сделать вывод о значимости или отсутствии значимости согласия данных с гипотезой независимости признаков.

 

Замечание.         Для представленных данных критический уровень значимости близок к своему пороговому значению в 5%. Поэтому сделан такой расплывчатый вывод о возможной зависимости между уровнем курения и величиной кровяного давления.

 

Пример.

Рассмотрим пример применения критерия сопряженности хи-квадрат к данным, которые в следующих двух заданиях будут использованы для проверки гипотезы независимости по критерию Стьюдента и для построения линий регрессии.

 

  A B C D E F G H I J K
1    X Y <119,7 121,3 122,9 >122,9 Σ  

Таблица квадратов

расхождений

2 <52,55 1 5 10 5 21   0,003 0,025 0,154 0,132
3 56,05 4 28 17 4 53   0,022 0,315 0,176 0,034
4 59,55 7 12 4 0 23   0,152 0,133 0,022 0,000
5 >59,55 2 2 0 0 4   0,071 0,021 0,000 0,000
6 Σ 14 47 31 9 101       X 2 = 26,35
7                   0,002
8    

Вывод:

Признаки зависимы

     

Замечание.     Кроме вывода о значимом отклонении гипотезы независимости по этой таблице также можно сказать, что при увеличении признака X  следует ожидать уменьшения признака Y – данные как бы концентрируются возле второй главной диагонали.


Контрольные вопросы.

1. Сформулируйте статистическую задачу.

2. Что такое независимость случайных величин?

Ответ: см. [4] стр. 62.

3. Выпишите формулу для вычисления статистики критерия сопряженности хи-квадрат.

Ответ: см. [4] стр. 64.

4. Почему эта статистика может служить мерой близости данных к гипотезе независимости?

Ответ: см. [4] стр. 64.

5. Чему равен критический уровень значимости критерия сопряженности признаков?

Ответ: см. [4] стр. 64.

6. Каким еще критерием (и в каком случае) можно проверить гипотезу независимости двух наблюдаемых характеристик?

Ответ: см. [4] стр. 66.


Задания 15-16.


Дата добавления: 2018-04-05; просмотров: 725; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!