Измерение связей между качественными признаками
ПРАКТИЧЕСКОЕ ЗАНЯТИЕ №14
Тема 8: «Статистические методы измерения взаимосвязей».
Цель занятия: изучить виды статистической взаимосвязи, получить практические навыки измерения связей между качественными признаками.
Понятие статистической взаимосвязи
Основная задача науки – вскрыть наиболее важные, наиболее существенные взаимозависимости между признаками явлений и процессов, изучаемых этой наукой, для установления законов их изменения. Общественные явления, в том числе и юридически значимые, взаимосвязаны между собой, зависят друг от друга и обусловливают друг друга.
В процессе статистического исследования объективно существующих взаимосвязей вскрываются причинно-следственные отношения между явлениями, что позволяет выявлять факторы (признаки, оказывающие основное влияние на вариацию изучаемых явлений и процессов). Признаки, изменение которых приводит к изменению других, связанных с ними признаков, называют факторными или просто факторами. А признаки, изменяющиеся вследствие изменения факторных признаков, называют результативнымиили результатами.
Различают два вида (типа) связей: функциональную (жестко детерминированную) и статистическую (стохастически детерминированную).
Функциональные связи характеризуются полным соответствием между изменением факторного признака и результативного признака, т.е. каждому значению фактора соответствуют определенные значения результата. Так изменение температуры окружающей среды (факторный признак) приводит к изменению высоты ртутного столбика (результативный признак) термометра. Между длиной радиуса (факторный признак) и площадью круга (результативный признак) тоже существует функциональная связь, показывающая что каждой величине радиуса будет соответствовать определенная площадь круга
.
Функциональная связь двух величин возможна лишь при условии, что вторая из них зависит только от первой и ни от чего более. В общественных явлениях такие связи практически не встречаются, так как результативный признак часто зависит от нескольких факторных признаков, что делает невозможным установление строго математической связи между конкретным фактором и каким-либо зависящим от него явлением.
При стохастически детерминированной связи разным значениям одной переменной соответствуют разные распределения значений другой переменной. Частным случаем статистической связи является корреляционная связь. Под корреляционной зависимостью понимается взаимосвязь между признаками, состоящая в том, что средняя величина значений одного признака меняется в зависимости от изменения другого признака (например зависимость между раскрываемостью преступлений и стажем работы оперативного состава органов дознания, между аварийностью и профессионализмом водителей автотранспорта, между числом судимостей преступника и временем его нахождения на свободе). Слово «корреляция» (corelation) ввел в употребление в статистике английский биолог и статистик Ф. Гальтон (1822 - 1911) в конце XIX века.
Основная задача корреляции заключается в том, чтобы на основе строго математических приемов установить количественное выражение этой зависимости, которая существует между исследуемыми признаками, абстрагируясь при этом от влияния всех других признаков.
Причинная зависимость между каждым признаком-фактором и признаком-результатом характеризуется неоднозначностью: тот или иной признак-результат изменяется под воздействием комплекса признаков-факторов, а каждому значению признака-фактора соответствует (под влиянием других признаков-факторов) несколько значений признака-следствия. Поэтому связь между причиной (совокупностью причин) и следствием (преступлением или преступностью) многозначна и носит вероятностный характер.
Между криминогенными факторами и преступностью существует прямая корреляционная связь (со знаком «+»). Например, чем выше уровень алкоголизации в обществе, тем выше преступность, причем преступность специфичная («пьяная»). Между факторами антикриминогенными и преступностью действует обратная корреляционная зависимость (со знаком «-»). Например, чем выше социальный контроль в обществе, тем ниже преступность. И прямые, и обратные связи могут быть прямолинейными и криволинейными.
Прямолинейные (линейные) связи проявляются тогда, когда с увеличением значений признака-фактора происходит возрастание (прямая) или уменьшение (обратная) величины признака следствия. Математически такая связь выражается уравнением прямой (уравнением прогрессии):
, где
- признак-следствие;
и
- соответствующие коэффициенты связи;
- признак-фактор.
Криволинейные связи характеризуются тем, что возрастание величины факторного признака оказывает неравномерное влияние на величину результирующего признака. Вначале эта связь может быть прямой, а затем – обратной. В юридической науке такие связи изучаются мало.
Корреляционные прямолинейные связи могут быть однофакторными, когда исследуется связь между одним признаком-фактором и одним признаком-следствием (парная корреляция). Они могут быть многофакторными, когда исследуется влияние многих взаимодействующих между собой признаков-факторов на признак-следствие (множественная корреляция).
Парная корреляциядавно находит применение в судебной статистике, а множественная корреляцияпрактически не используется, хотя в криминологии, деликтологии и социологии права многофакторные связи, можно сказать, доминируют.
Корреляционные связи одних явлений с другими видны уже на первых стадиях статистической обработки данных. Сводка и группировка статистических показателей, исчисление относительных и средних величин, построение вариационных, динамических, параллельных рядов позволяет установить наличие взаимосвязи изучаемых явлений и даже ее характер (прямой и обратный).
Измерение связей между качественными признаками
Статистические методы различных обобщений, указывая на наличие прямой или обратной связи между признаком-фактором и признаком-следствием, не дают ответа на вопрос о мере связей, ее количественном выражении. Этот недостаток восполняется методами корреляционного анализа, которые позволяют вычленить из комплекса факторов влияние одного или многих обстоятельств, установить характер взаимосвязи и математически точно измерить ее.
Для измерения связи между качественными (атрибутивными) признаками в статистике широко используются коэффициент сопряженности А.А. Чупрова, коэффициент ассоциации К. Пирсона, а также коэффициенты ранговой корреляции Спирмена и Кендалла.
1. Коэффициент ассоциации К. Пирсона (КП)в плане исчисления - относительно простой показатель сопряженности величин, он применяется к вариации двух качественных признаков. Его расчет производится на основе таблицы, именуемой таблицей четырех полей.
Пусть данные представлены в виде частот наблюдаемы признаков, попавших в некоторые классы. Имеются два признака А и В, каждый из которых разбивается на два класса и принимает альтернативные значения: есть признак или нет. Тогда данные можно представить в виде таблицы четырех полей.
Таблица четырех полей
|
Признак А
| Признак В | Сумма | |
|
| ||
|
|
|
|
|
|
|
|
| Сумма |
|
| – |
Этими полями являются клетки а, b, с, d. Расчет осуществляется на основе сопряжения по строкам a и b,c и d, aтакже по графам а и с, b и d. Формула расчета:
.
Ассоциируемые показатели могут быть как абсолютными, так и относительными. Следует отметить, что абсолютные показатели громоздки и расчет КП на их основе производится на компьютере. Расчеты КП на основе относительных показателей значительно проще.
Коэффициент ассоциации измеряется от - 1 до +1 и интерпретируется так: чем ближе коэффициент к 1, тем теснее связь, положительная или отрицательная. Считается, что если КП достигает 0,3, то это свидетельствует о существенной связи между признаками.
2. Коэффициент взаимной сопряженности,разработанный отечественным статистиком А.А. Чупровым(КЧ) применяется для измерения связи между двумя атрибутивными признаками по трем и более группам. Он рассчитывается по формуле
,
где КЧ - коэффициент взаимной сопряженности А.А. Чупрова;
- показатель взаимного сопряжения (фи квадрат);
и
- число групп по каждому признаку; 1 - постоянный коэффициент. Поскольку число групп всегда известно, то для расчета КЧ необходимо найти
(фи квадрат).
Порядок отыскания
рассмотрим при помощи таблицы. В таблице приведены числовые значения частот по видам преступлений: разбой, мошенничество, умышленное убийство, поджог.
1. Необходимо возвести числовые значения частот для столбцов «раскрыто», «нераскрыто» во вторую степень (1102=12100, 402=1600, 1802=32400, 652=4225 и т.д.) и указать полученные значения на месте, обозначенном в таблице п.1 (вместо обозначения п.1 указываем результат выполнения 1 пункта расчета).
2. Далее необходимо найти сумму частот по столбцам (для столбца «раскрыты» 110+180+50+10=350, для столбца «не раскрыты» 40+65+25+20=150) и занести в нижнюю строку «итого» таблицы вместо обозначения п.2.
3. Затем найдем отношение квадратов частот к сумме частот по столбцам (12100/350=34,57; 32400/350=92,57 и т.д.) и укажем полученные значения в таблице вместо обозначения п.3.
4. Для дальнейшего заполнения столбца «итого» найдем сумму значений по строке, найденных в п. 3. (34,57+10,67=45,24, 92,57+28,17=120,74 и т.д.), полученные значения указываем в столбце «итого» вместо обозначений п.4.
5. Далее найдем отношение значений полученных в п.4 к общему числу частот (верхнее значение в каждой строке графы «итого») 45,24/150=0,3; 120,74/245=0,49 и т.д., полученные значения указываем в столбце «итого» вместо обозначений п.5.
6. Найдем сумму значений четвертой строки графы «итого» (0,3+0,49+0,15+0,1=1,04), полученное значение указываем в столбце «итого» вместо обозначений п.6.
7. Получим значение
как разность 1,04-1=0,04.
Дата добавления: 2018-06-01; просмотров: 340; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!
