ЗАВИСИМОСТЬ СТАТИСТИЧЕСКАЯ - Взаимосвязь двух признаков или величин



Целесообразно также использование такой пары понятий, как глобальные — локальные меры связи. Эта пара понятий необходима для условного обозначения следующей ситуации. Вернемся к таблице сопряженности для нашего случая. Как было отмечено, определить связь между будущей профессией студента и удовлетворенностью учебой можно, сравнивая их условные распределения. В этом случае речь идет как бы о связи этих двух признаков в целом. Меры, отражающие эту целостность, можно определить условно как меры «глобального» арактера для таблицы сопряженности. К такого рода мерам относятся коэффициенты, основанные на величине «х и-квадрат» и Гудмена-Краскала.

В то же время можно поставить вопрос о связи следующим образом. Например, связана ли самая низкая удовлетворенность учебой с второй профессией (социолог). Тогда речь идет условно как бы о связях в локальном смысле. Для таких случаев существуют также коэффициенты связи. Это такие коэффициенты, как коэффициент Юла, показатели детерминации.

Вместо рассмотренной нары направленная связь — ненаправленная можно пользоваться терминами: симметричная связь — асимметричная. При вычислении направленных коэффициентов связи между признаками X и Y, как правило, оказывается, что значение коэффициента для X^ Y не равно значению для X^Y. Два признака неравноправны, их нельзя формально поменять местами. Отсюда возникают асимметричные коэффициенты. Они не всегда удобны для использования в сложных математических методах. Потому при двух асимметричных коэффициентах всегда существует третий, как бы их усредняющий. Мы столкнемся с тройкой мер Гуттмана и с тройкой мер Гудмена - Краскала.

Перейдем к рассмотрению взаимосвязанных пар понятий, таких, как непосредственная связ ь — опосредованная, истинное (значение коэффициента) — ложное. Первая пара понятий важна при интерпретации количественного значения коэффициента связи. Здесь необходимо отметить, что по таким значениям не всегда ложно говорить о силе связи (сильная — слабая). В ряде случаев просто констатируется наличие или отсутствие определенным образом понимаемой связи. Если по конкретному значению коэффициента мы видим, что связь есть, то это вовсе не означает существования в реальности непосредственной связи между двумя изучаемыми признаками, а может означать наличие опосредованной связи. Отсюда вторая пара понятий: истинное значение — ложное. В литературе тому есть множество примеров. Например, в США за 1870—1910 годы было установлено наличие связи между заработной платой учителей и потреблением вина. Это пример ложной связи. Ибо она была опосредована тем, что в эти годы наблюдался промышленный бум и рост заработной платы и тем самым рост потребления вина во всех группах населения. В нашем случае можно сказать, что связь между будущей профессией студента и удовлетворенностью учебой есть. Но она может носить ложный характер, т.е. опосредована другими признаками. Например, социальным происхождением, успеваемостью, удовлетворенностью жизнью,

уверенностью в завтрашнем дне и т. д.

Возможна и другая ситуация, когда значение коэффициента связи указывает на ее отсутствие, а на самом деле связь существует. Пример приведем в следующем разделе книги для случая таких признаков, как удовлетворенность собой и удовлетворенность жизнью.

Еще несколько слов о статистической зависимости — статистической независимости. Это очень важные понятия. Вернемся опять к нашей таблице сопряженности и задаче сравнения условных распределений. Выше, исходя из элементарного здравого смысла, мы пришли к необходимости использования направленных мер связи для определения различия в структурах распределения. Тем самым для определения: наблюдается ли статистическая зависимость между будущей профессией студента и удовлетворенностью учебой. Но для определения статистической зависимости можно исходить и из другой модели, из других соображений. Поставим вопрос так. Какая величина может стоять в ячейке таблицы сопряженности, если эти признаки статистически независимы? Разумеется, такой вопрос правомерен. При этом маргинальные частоты (одномерные, простые) нам известны по нашей выборке.

Рассмотрим, к примеру, ячейку (2,1). Она соответствует будущим социологам, неудовлетворенным учебой. Статистическую независимость признаков «будущая профессия» и «удовлетворенность учебой» можем понимать следующим образом. Доля неудовлетворенных учебой социологов среди всех студентов-социологов равна доле не удовлетворенных учебой студентов среди всех студентов-гуманитариев. Ведь такое понимание связи не должно вызывать у вас неприятия, ибо не противоречит здравому смыслу социолога. Тогда в ситуации статистической независимости легко определяется то значение, которое должно стоять в нашей ячейке. Оно вычисляется исходя из упомянутой выше пропорции. К ней мы вернемся при рассмотрении мер связи, основанных на так называемой величине «хи- квадрат».

Многие коэффициенты связи как раз и определяют отклонение реальных частот (того, что получено по выборке) от частот как бы теоретических, т. е. вычисленных по той же таблице, но для случая статистической независимости.

И наконец, обратим внимание еще на одну пару понятий. Социолога интересует связь между признаками для выявления причинно-следственных отношений между признаками. Поэтому он изучает связи всегда в контексте: влияет — не влияет; детерминирует — не детерминирует; увеличивает информацию — не увеличивает; улучшает прогноз — не улучшает и т. д. После всех наших предыдущих рассуждений является очевидным, что наличие корреляционной связи не говорит о причинности [3. с. 72—119; 11. с. 43—63]. И в то же время для причинного анализа невозможно обойтись без изучения корреляционных связей. Термином «причинный анализ» принято обозначать специфический класс математических методов. Вместе с тем проблема причинности в нашей науке очень интересная, сложная область, которую нельзя свести только к классу математических методов.

Итак, мы познакомились с дихотомическими парами понятий, которые важны для изучения и понимания связи, т. е. для эмпирической интерпретации понятия «связь». Они таковы:

причинная — корреляционная; функциональная — корреляционная; направленная — ненаправленная; локальная — глобальная; истинная —ложная; статистическая зависимость — статистическая независимость; симметричная — асимметричная; непосредственная — опосредованная; линейная — нелинейная.

Коэффициенты связи, меры связи бывают не только парные (мы будем рассматривать только такие), но и частные, множественные. Различают коэффициенты для номинального, порядкового, метрического уровня измерения. Сами таблицы сопряженности бывают разные. Они бывают и многомерные, если сопрягаются несколько признаков, и тогда их называют таблицами с несколькими входами. Очень интересной в социологии явля ется таблица сопряженности квадратного вида (число строк равно числу столбцов), когда сопрягается признак с самим собой. Она возникает в ситуации панельного исследования. Представим себе, что тех же студентов- гуманитариев мы опросили повторно через пару лет. Тогда таблица для двух признаков, например, «уверенность в завтрашнем дне в 1997 году» и «уверенность в завтрашнем дне в 1999 году», позволит изучить степень изменчивости такой уверенности. Для анализа таких таблиц сопряженности существуют специфические меры связи.

Задание на семинар или для самостоятельного выполнения 1.

На основе той же самой матрицы данных составить таблицу сопряженности между первым (номинальная шкала) и вторым (порядковая шкала) признаками. В каждой ячейке таблицы подсчитать значение четырех показателей: абсолютную частоту и относительные частоты в долях (частости) по всем объектам, по строке и по столбцу. 2.

На одном и том же рисунке построить эмпирические кривые распределения по первому признаку для различных групп объектов, выделенных по отдельным значениям второго признака. Сравнить эти кривые и сделать выводы о характере связи двух признаков, о наличии типологических синдромов. 3.

На одном и том же рисунке построить эмпирические кривые распределения по второму признаку для различных групп объектов, выделенных по отдельным значениям первого признака. Сравнить эти кривые и сделать выводы о характере связи двух признаков, о наблюдаемых эмпирических закономерностях. 4.

 


Дата добавления: 2018-02-15; просмотров: 411; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!