Коэффициент взаимной сопряженности

РАЗДЕЛ 7. СТАТИСТИЧЕСКОЕ ИЗУЧЕНИЕ СВЯЗИ

 

7.1. Виды и формы взаимосвязи между явлениями

Одной из важнейших задач статистики является изучение, измерение и количественное выражение взаимосвязи между явлениями общественной жизни, установленной на основе качественного анализа.

Различают два вида связей: функциональную и корреляционную, обусловленные двумя типами закономерностей: динамическими и статистическими.

Для явлений, в которых проявляются динамические закономерности, характерна жесткая, механическая причинность, которая может быть выражена в виде уравнения, четкой зависимости и т.д. Такая зависимость называется функциональной. При функциональной связи каждому значению одной величины (аргумента) соответствует одно или несколько вполне определенных значений другой величины (функции).

В общественных процессах, в которых проявляются статистические закономерности, нет строгой зависимости между причиной и результатом и обычно не представляется возможным выявить строгую зависимость.

Связь, при которой каждому значению аргумента соответствует не одно, а несколько значений функции и между аргументом и функциями нельзя установить строгой зависимости называется корреляционной. Корреляционная зависимость проявляется только в средних величинах и выражает числовое соотношение между ними в виде тенденции к возрастанию или убыванию одной переменной величины при возрастании или убывании другой.

По направлению различают прямую и обратную связи.

По аналитическому выражению корреляционная связь может быть прямолинейной и криволинейной.

 

7.2. Основные приемы изучения взаимосвязей

а) Метод параллельных рядов. Чтобы установить связь между явлениями достаточно расположить полученные в результате сводки и обработки материалы в виде параллельных рядов и сопоставить их между собой.

б) Балансовый метод. Для характеристики взаимосвязи между явлениями в статистике широко применяется балансовый метод. Сущность его заключается в том, что данные взаимосвязанных показателей изображаются в виде таблицы и располагаются таким образом, чтобы итоги между отдельными частями были равны, т.е. чтобы был баланс. Балансовый метод используется для характеристики взаимосвязи между производством и распределением продуктов, денежными доходами и расходами населения и т.д.

в)Метод аналитических группировок. При наличии массовых статистических данных для изучения и измерения взаимосвязей социально-экономических явлений широко пользуются методом аналитических группировок. Аналитические группировки позволяют установить наличие связи между двумя и более признаками и ее направление. Метод группировок сочетается с методом средних и относительных величин.

г) Дисперсионный анализ. Аналитические группировки при всей своей значимости не дают количественного выражения тесноты связи между признаками. Эта задача решается при помощи дисперсионного и корреляционного анализов.

Дисперсионный анализ дает, прежде всего, возможность определить роль систематической и случайной вариаций в общей вариации и, следовательно, установить роль изучаемого фактора в изменении результативного признака. Для этого пользуются правилом сложения дисперсий.

 

7.3. Корреляционный анализ

Определение формы связи

Изучение взаимосвязей между признаками статистической совокупности заключается в определении формы и количественной характеристики связи, а также степени тесноты связи. Корреляционный анализ и решает эти двеосновныезадачи.

Первая задача заключается в определении формы связи, т.е. в установлении математической формы, в которой выражается данная связь.

Предварительный этап при установлении формы связи заключается в теоретическом анализе изучаемого явления, а также в представлении искомой связи графически. График, построенный по исходным данным, позволяет приблизительно определить: есть ли какая-то связь между явлениями; ее направление (прямая или обратная); примерную тесноту связи (естественно, что при графическом анализе используются  только две переменные). 

Применение методов корреляционного анализа дает возможность выражать связь между признаками аналитически - в виде уравнения - и придавать ей количественное выражение.

Другими словами необходимо найти зависимость вида y=f(x),причем в качестве функции f(x) могут быть

полином 1-го порядка -

полином 2-го порядка -

степенная функция -   

гиперболическая функция -

(могут быть использованы и другие виды функций).

Неизвестные параметры функций (аналитических уравнений связи) находятся методом наименьших квадратов, сущность которого в следующем: сумма квадратов отклонений фактических данных от выровненных должна быть наименьшей (см. рисунок):

или

y
x
Ù  
y
 Отклонение фактических уровней от выровненных

Измерение тесноты связи

При изучении корреляционной связи важно выяснить не только форму, но и тесноту связи между факторным и результативным признаком. Для этого (при прямолинейной связи) рассчитывается показатель, называемый парным линейным коэффициентом корреляции , вычисляемый по формуле

.

Коэффициент корреляции принимает значение от -1 до +1, причем если >0, то корреляция прямая, если <0, то корреляция обратная, а если =0, то корреляция отсутствует полностью.

В зависимости от того, насколько  приближается к единице, различают связь слабую, умеренную, заметную, высокую, тесную и весьма тесную.

Коэффициент корреляции может быть исчислен и по следующей формуле

,

где  - среднее квадратическое отклонение результативного признака;

 - среднее квадратическое отклонение факторного признака.

Зная линейный коэффициент корреляции, можно определить и параметры уравнения регрессии вида  потому что:

.

Коэффициент корреляции  применяется только в тех случаях, когда между явлениями существует прямолинейная связь. Если же связь криволинейная, то пользуются коэффициентом корреляции, вычисляемым по формуле

,

где y- исходные значения результативного показателя;

  -теоретические значения;

  -среднее значение y.

Имея среднее значение дисперсий, коэффициент корреляции можно вычислить как   

,

где  - факторная (межгрупповая) дисперсия или дисперсия воспроизводимости;

 - случайная (средняя из внутригрупповых) дисперсия или остаточная дисперсия;

 - общая дисперсия.

Коэффициент корреляции по своему абсолютному значению находится в пределах от 0 до 1.

Если коэффициент корреляции возвести в квадрат и выразить в процентах, получим показатель, называемый коэффициентом детерминации

D=R2∙100%.

Он показывает, на сколько процентов изменение результативного фактора зависит от изменения факторного признака. Коэффициент детерминации является наиболее конкретным показателем, так как он отвечает на вопрос о том, какая доля в общем результате зависит от фактора, положенного в основании группировки.

7.4. Множественная корреляция

Определение формы и тесноты связи между тремя и более параметрами называется множественной корреляцией. При множественной корреляции определение формы связи аналогично определению формы связи при парной корреляции, а само уравнение регрессии ищется в виде (как правило)

.

При определении тесноты связи есть свои особенности. Теснота связи измеряется множественным коэффициентом корреляции, вид которого аналогичен коэффициенту корреляции при парной связи

.

Если изучается взаимодействие только трех факторов y=f(x,z), то коэффициент множественной корреляции можно определить по формуле

,

где - парные коэффициенты корреляции.

Множественный коэффициент корреляции находится в пределах от 0 до 1.

Множественный коэффициент детерминации, равный квадрату R, выраженному в процентах, характеризует долю вариации результативного признака Y под воздействием всех изучаемых факторных признаков.

Поскольку факторные признаки действуют не изолировано, а по взаимосвязи, то может возникнуть задача определения тесноты связи между результативным признаком и одним из факторных при постоянных значениях прочих факторов. Она решается при помощи частных коэффициентов корреляции. Например, при линейной связи y=f(x,z) частный коэффициент корреляции между x и y при постоянном z вычисляется по следующей формуле

.

Частный коэффициент корреляции при изучении зависимости Y от Z при постоянном Х определяется по формуле

.

Парные коэффициенты корреляции, как правило, выше частных. Это объясняется тем, что факторы взаимно коррелируют между собой.

При значительном количестве факторов частный коэффициент корреляции можно получить по формуле

,

где - коэффициент множественной корреляции; - коэффициент множественной корреляции результативного фактора (y) со всеми за исключением исследуемого.

 

7.5. Простейшие методы измерения тесноты связи

 Измерение тесноты связи между факторами с помощью корреляционно-регрессионного и дисперсионного анализов сопряжено с большими вычислительными трудностями. Для ориентировочной оценки степени тесноты связи существуют приближённые методы, не требующие трудоемких расчетов. К ним относятся:коэффициент корреляции знаков Фехнера, коэффициент корреляции рангов , коэффициент ассоциации и коэффициент взаимной сопряженности.

1. Коэффициент корреляции знаков.

Основан на сопоставлении знаков отклонений от средней и подсчете числа случаев совпадения и несовпадения знаков. Коэффициент корреляции знаков определяется по формуле

,

где U - число пар с одинаковыми знаками отклонений x и y от  и ;

V- число пар с разными знаками отклонений x и y от  и .

Коэффициент корреляции знаков колеблется от -1 до +1. Этот показатель исчисляется очень просто, но именно в силу этого он не очень точен.

2. Коэффициент корреляции рангов. Этот показатель вычисляется не по первичным данным, а по рангам (порядковым номерам ), которые присваиваются всем значениям изучаемых признаков, расположенным в порядке их возрастания. Если значения признака совпадают, то определяется средний ранг путем деления суммы рангов на число совпадающих значений. Коэффициент корреляции рангов определяется по формуле

,

где - квадрат разности рангов для каждой единицы d=x-y

 Коэффициент корреляции рангов также колеблется в пределах от -1 до +1.

3. Коэффициент ассоциации.

Коэффициент ассоциации применяется для установления меры связи между двумя качественными альтернативными признаками. Для его вычисления строится комбинационная 4-клеточная таблица:

а б
с д

которая выражает связь между двумя альтернативными явлениями.

Коэффициент ассоциации рассчитывается по формуле

.

Коэффициент ассоциации тоже колеблется в пределах от -1 до +1.

Коэффициент взаимной сопряженности

В тех случаях, когда требуется установить связь между качественными признаками, каждый из которых состоит из трех и более групп, применяется коэффициент взаимной сопряженности. Для определения степени тесноты связи вычисляется специальный показатель, который называется коэффициентом взаимной сопряженности. Он определяется по формуле:

,

где n - число единиц совокупности;

m1 и m2- число групп по первому и второму признаку;

 - показатель абсолютной квадратичной сопряженности Пирсона.

Методика применения всех четырех коэффициентов показана при решении типовых задач. 


Дата добавления: 2019-09-13; просмотров: 568; Мы поможем в написании вашей работы!

Поделиться с друзьями:




Мы поможем в написании ваших работ!