Решение типовой задачи – элементарные методы выявления взаимосвязей

Лабораторная работа № 6 - Статистическое изучение взаимосвязи социально-экономических явлений

Цели и задачи лабораторной работ

Цель работы - является ознакомление студентов с основными методами выявления и измерения корреляционной связи, при этом будут решаться следующие задачи:

1) Ознакомится с алгоритмом построения корреляционного поля;

2) Рассмотреть методы выявления взаимосвязи;

3) Рассмотреть коэффициенты измерения корреляционной взаимосвязи;

4) Построить регрессионную модель и провести на ее основе моделирование.

Теоретические основы изучения взаимосвязей социально-экономических явлений

В экономических исследованиях различают следующие варианты зависимостей:

Парная - связь между двумя признаками, один из которых результативный, а другой факторный.

Рисунок 6.1 – Пример парной корреляции

Частная - зависимость между результативным и одним факторным признаком, при фиксированном значении других факторных признаков.

x ₁ x ₂ x ₃

Рисунок 6.2 – Пример частной корреляции

Множественная - зависимость результативного признака от нескольких факторных признаков.

x ₁

x ₂

x ₃

Рисунок 6.3 – Пример множественной корреляции

Каноническая - зависимость группы результативного признака от группы факторных признаков.

x ₁ x ₂ x ₃

y ₁ y ₂ y ₃

Рисунок 6.4 – Пример канонической корреляции

Для выявления и измерения силы взаимосвязи в эконометрике используют ряд подходов:

Элементарные методы (приближенные)

Сопоставление двух параллельных рядов

Построение аналитической группировки

Графический метод

Точные методы

Парные коэффициенты корреляции

Частные коэффициенты корреляции

Множественные коэффициенты корреляции

Подходы к выявлению и измерению корреляционной взаимосвязи

Рисунок 6.5 – Подходы к измерению корреляционной связи

Кратко раскроем сущность представленных методов:

По-видимому, самым простым способом установления наличия взаимосвязи между двумя признаками является графический метод. Суть его заключается в построение поля корреляции, где по оси OX откладывают значения независимой переменной, а по оси OY значения зависимой.

Возможны несколько вариантов расположения точек на данном графике:

Рис. а прямая взаимосвязь

Рис. б обратная взаимосвязь

Рис. в нелинейная взаимосвязь

Рис. г отсутствие взаимосвязи

Рисунок 6.6 – Варианты распределения точек в корреляционном поле

Сопоставление двух параллельных рядов. Значения факторного признака располагают в возрастающем порядке и затем прослеживают направление изменения величины результативного признака.

Возможны три варианта взаимного сочетания переменных:

1. при этом - можно предположить наличие прямой взаимосвязи;

2. при этом - можно предположить наличие обратной взаимосвязи;

3. при этом - можно предположить отсутствие взаимосвязи.

Построение аналитической группировки, где все наблюдения разбиваются на группы по величине факторного признака, и по каждой группе вычисляется среднее значение результативного признака.

Возможны три варианта взаимного сочетания групповых средних:

1. при этом - можно предположить наличие прямой взаимосвязи;

2. при этом - можно предположить наличие обратной взаимосвязи;

3. при этом - можно предположить отсутствие взаимосвязи.

Приведенные подходы имеют ряд недостатков: во-первых, с их помощью возможно лишь выявить взаимосвязь, но не измерить ее; во-вторых, использование данных методов ограничено лишь парной корреляцией.

Более совершенным подходом считается расчет коэффициентов корреляции.

Таблица 6.1 – Коэффициенты корреляции

Название

Формула для расчета

Интервал значения

Для какого типа данных используется

Коэффициент ассоциации Д. Юла

а, b , с, d - частоты взаимного сочетания (комбинации) двух альтернативных признаков

|Ка| > 0,5 - связь значима

качественные альтернативные признаки

Коэффициент контингенции К. Пирсона

|Кк| >0,3 - связь значима

качественные альтернативные признаки

Коэффициент корреляции рангов Чарльза Эдварда Спирмена

- ранги по результативному и факторному признаку

[-1; +1]

качественные или количественные ранжируемые признаками

Коэффициент корреляции знаков Густава Теодора Фехнера

C - число совпадений знаков H - число несовпадений знаков отклонений индивидуальных величин от средней

[-1; +1]

количественные признаками

Коэффициент линейной корреляции Карла Пирсона

[-1; +1]

количественные признаками

Коэффициент взаимной сопряженности К. Пирсона

- показатель взаимной сопряженности

[0; +1]

качественные признаки

Коэффициент взаимной сопряженности А.А. Чупрова

К₁, К₂ – число строк и граф в таблице

[0; +1]

качественные признаки

Множественный коэффициент ранговой корреляции М. Кендэла и Б. Смита

S - сумма квадратов отклонений суммы m рангов от их средней величины; m - число ранжируемых признаков; n - число ранжируемых единиц (число наблюдений).

[0;+1]

качественные признаки

Множественный коэффициент корреляции

- среднее значение зависимой переменной;

– теоретические значения

[0;+1]

количественные признаками

Частные коэффициенты корреляции ( )

[0;+1]

количественные признаками

Для интерпретации результатов оценки коэффициентов корреляции на практике часто используется шкала Чеддока.

Таблица 6.2 – Сила корреляционной связи по шкале Чеддока

Показания тесноты связи	до ±0,3	от ±0,3 до ±0,5	от ±0,5 до ±0,7	от ±0,7 до ±0,9	от ±0,9 до ±0,99
Характеристика связи	слабая	умеренная	заметная	высокая	весьма высокая

Знак коэффициента указывает на направление связи между исследуемыми признаками, так «-» указывает на обратную связь (рисунок 2.6(а)), а «+» указывает на прямую связь (рисунок 2.6(б)).

Если в ходе исследования значение коэффициента строго равно нулю это указывает на то, что между признаками отсутствует взаимосвязь, соответственно в случае, когда коэффициент равен ±1 взаимосвязь носит функциональный характер.

Как известно из курса эконометрики относительно формы зависимости выделяют линейную и не линейную регрессии, при этом относительно числа независимых переменных включенных в модель выделяют – парную и множественную.

Корреляционный анализ как правило дополняется регрессионным, заключающимся в построении линейных или не линейных, парных или множественных уравнений. В данной лабораторной работе остановимся на самом простом случае на линейной модели.

Множественная линейная регрессия представляет собой модель зависимости результативного признака с двумя и большим числом факторов, т. е. модель вида:

Парная линейная регрессия представляет собой частный случай множественной регрессии и есть модель между двумя переменными - у и х, т.е. имеем:

где: i =1, 2, …, n

n – объем изучаемой совокупности;

– данные полученные в результате построения модели (теоретические уровни, модельные данные)

– зависимая переменная;

– независимая переменная;

– искомые (неизвестные) параметры (коэффициенты) уравнения регрессии;

– случайная величина (возмущение, остатки, отклонения).

Основным методом решения задачи нахождения параметров уравнения связи является метод наименьших квадратов (МНК).

Суть МНК состоит в минимизации суммы квадратов отклонений фактических значений от значений, вычисленных по уравнению связи.

или

В случае парной линейной регрессии для нахождения необходимо решить систему нормальных уравнений:

Преобразуя предложенную систему получить следующие формулы для нахождения параметров уравнения:

– не имеет экономической интерпретации, но существует мнение, что он показывает усредненное влияние всех прочих факторов, не включенных в исследование.

– показывает, на сколько в среднем изменится величина результативного признака y при изменении факторного признака x на натуральную единицу.

Если >0 то связь прямая, если < 0 то связь обратная.

В случае множественной линейной регрессии система нормальных уравнений значительно увеличивается, так в случае двух независимых переменных имеем следующую систему:

Для ее решения относительно неизвестных параметров можно поступить несколькими способами:

1. Использовать возможности специализированных пакетов программ (Excel, Stata, Statistica, MathCad и др.).

2. Использовать решение системы посредством матричной алгебры:

где:

3. Использовать для нахождения параметров общий и частные определители системы.

Общий определитель системы равен:

Частные определители:

Решение системы может быль осуществлено методом определителей:

; ;

где: - определитель системы;

– частные определители.

Решение типовой задачи – элементарные методы выявления взаимосвязей

Проиллюстрируем алгоритм выявления наличия взаимосвязи между социально-экономическими явлениями на основе следующих данных:

Таблица 6.3 – Вариация показателей характеризующих результаты экономической деятельности промышленных предприятий

y	12,3	9,9	15,1	10,4	13,1	12,4	13,2	11,8	11,5	14,2	14,4	12,1	13,1	11,5	10,6
x₁	280	210	323	221	295	271	276	284	260	310	293	239	254	240	246
x₂	3,12	1,25	4,98	1,35	3,25	2,99	3,69	2,65	2,1	3,75	4,57	2,94	3,56	2,24	1,45

где: y – Чистая прибыль, млн. руб.

– Численности промышленно-производственного персонала, чел

– Среднегодовой стоимости основных производственных фондов, млн. руб.

Для построения корреляционного поля необходимо по оси OY отложить значения переменной y, а по оси OX отложить значения переменной .

При построении данного графика рекомендуется откладывать значения показателя не от нуля, а от минимального значения показателя, в этом случае график будет информативен. В рассматриваемом примере минимальное значение переменной y наблюдается у второго предприятия равное 9,9 млн. руб., соответственно начало отсчета необходимо начинать от значения 9. По переменной минимальное значение равно 210 чел. соответственно откладывать необходимо от 200.

В главном меню табличного редактора Excel выберем Вставка ® Диаграмма, в появившемся окне Мастера диаграмм выберем Точечная, в результате получим следующий график характеризующий зависимость y от .

Рисунок 6.7 – Корреляционное поле зависимости чистой прибыли от численности промышленно-производственного персонала

Согласно приведенному рисунку наблюдается рост показателя y с ростом показателя , т.е. можно предположить о наличии прямой связи между рассматриваемыми показателями.

Для реализации метода сопоставления параллельных рядов, необходимо упорядочить совокупность по переменной в возрастающем порядке, при этом автоматически будем переносить значения по переменной y соответствующего предприятия. Для этого в главном меню выбираем Данные ® Сортировка. В появившемся окне (рисунок 6.8) указываем переменную и нажимаем ОК.

Рисунок 6.8 – Сортировка диапазона

В результате осуществления данной процедуры получаем следующие результаты:

Рисунок 6.9 – Результаты выполнения метода сопоставления параллельных рядов

Результаты реализации процедуры сопоставления параллельных рядов при большом объеме совокупности (если приведены в виде таблицы) не информативны, поэтому рекомендуется приводить их в виде графика, при этом для увеличения информативности рисунка рассматриваемые данные необходимо размещать на разных осях, в нашем случае по оси OY отложим переменную y, а по оси OY 1 - . Т.е. выберем Вставка ® Диаграмма ® Мастер диаграмм ® График.

Рисунок 6.10 - Результаты выполнения метода сопоставления параллельных рядов

Результаты, отображенные на рисунке 6.10, указывают на наличие прямой связи между показателями.

Дата добавления: 2022-06-11; просмотров: 59; Мы поможем в написании вашей работы!

Поделиться с друзьями:

12 3 4 Следующая ⇒

Мы поможем в написании ваших работ!