Решение типовой задачи – элементарные методы выявления взаимосвязей



Лабораторная работа № 6 - Статистическое изучение взаимосвязи социально-экономических явлений

 

Цели и задачи лабораторной работ

 

Цель работы - является ознакомление студентов с основными методами выявления и измерения корреляционной связи, при этом будут решаться следующие задачи:

1) Ознакомится с алгоритмом построения корреляционного поля;

2) Рассмотреть методы выявления взаимосвязи;

3) Рассмотреть коэффициенты измерения корреляционной взаимосвязи;

4) Построить регрессионную модель и провести на ее основе моделирование.

 

Теоретические основы изучения взаимосвязей социально-экономических явлений

 

В экономических исследованиях различают следующие варианты зависимостей:

Парная - связь между двумя признаками, один из которых результативный, а другой факторный.

x
y

Рисунок 6.1 – Пример парной корреляции

Частная - зависимость между результативным и одним факторным признаком, при фиксированном значении других факторных признаков.

y
x 1 x 2 x 3

Рисунок 6.2 – Пример частной корреляции

Множественная - зависимость результативного признака от нескольких факторных признаков.

y
x 1
x 2
x 3

Рисунок 6.3 – Пример множественной корреляции

Каноническая - зависимость группы результативного признака от группы факторных признаков.

 

x 1 x 2 x 3
y 1 y 2  y 3

Рисунок 6.4 – Пример канонической корреляции

Для выявления и измерения силы взаимосвязи в эконометрике используют ряд подходов:

Элементарные методы (приближенные)
Сопоставление двух параллельных рядов
Построение аналитической группировки
Графический метод
Точные методы
Парные коэффициенты корреляции
Частные коэффициенты корреляции
Множественные коэффициенты корреляции
Подходы к выявлению и измерению корреляционной взаимосвязи

Рисунок 6.5 – Подходы к измерению корреляционной связи

 

Кратко раскроем сущность представленных методов:

По-видимому, самым простым способом установления наличия взаимосвязи между двумя признаками является графический метод. Суть его заключается в построение поля корреляции, где по оси OX  откладывают значения независимой переменной, а по оси OY значения зависимой.

Возможны несколько вариантов расположения точек на данном графике:

Рис. а прямая взаимосвязь
Рис. б обратная взаимосвязь

Рис. в нелинейная взаимосвязь
Рис. г отсутствие взаимосвязи

Рисунок 6.6 – Варианты распределения точек в корреляционном поле

Сопоставление двух параллельных рядов. Значения факторного признака располагают в возрастающем порядке и затем прослеживают направление изменения величины результативного признака.

Возможны три варианта взаимного сочетания переменных:

1.  при этом  - можно предположить наличие прямой взаимосвязи;

2.  при этом  - можно предположить наличие обратной взаимосвязи;

3.  при этом  - можно предположить отсутствие взаимосвязи.

Построение аналитической группировки, где все наблюдения разбиваются на группы по величине факторного признака, и по каждой группе вычисляется среднее значение результативного признака.

Возможны три варианта взаимного сочетания групповых средних:

1.  при этом  - можно предположить наличие прямой взаимосвязи;

2.  при этом  - можно предположить наличие обратной взаимосвязи;

3.  при этом  - можно предположить отсутствие взаимосвязи.

Приведенные подходы имеют ряд недостатков: во-первых, с их помощью возможно лишь выявить взаимосвязь, но не измерить ее; во-вторых, использование данных методов ограничено лишь парной корреляцией.

Более совершенным подходом считается расчет коэффициентов корреляции.

 

 

Таблица 6.1 – Коэффициенты корреляции

Название Формула для расчета Интервал значения Для какого типа данных используется
Коэффициент ассо­циации Д. Юла а, b , с, d - частоты взаимного сочетания (комбинации) двух альтернативных признаков |Ка| > 0,5 - связь значима качественны­е альтернативные признаки
Коэффициент контингенции К. Пирсона |Кк| >0,3 - связь значима качественны­е альтернативные признаки
Коэффициент корреляции рангов Чарльза Эдварда Спирмена  - ранги по результативному и факторному признаку [-1; +1] качественные или количественные ранжируемые признаками
Коэффициент корреляции знаков Густава Теодора Фехнера C - число совпадений знаков H -  число несовпа­дений знаков откло­нений индивидуальных величин от средней [-1; +1] количественные признаками
Коэффициент линейной корреляции Карла Пирсона [-1; +1] количественные признаками
Коэффициент взаимной сопряженности К. Пир­сона - показатель взаимной сопряженности [0; +1] качественны­е признаки
Коэффициент взаимной сопряженности А.А. Чупрова К1, К2 – число строк и граф в таблице [0; +1] качественны­е признаки
Множественный коэффициент ранговой корреляции М. Кендэла и Б. Смита S - сумма квадратов отклонений суммы m рангов от их средней величины; m - число ранжируемых признаков; n  - число ранжируемых единиц (число наблюдений). [0;+1] качественны­е признаки
Множественный коэффициент корреляции  - среднее значение зависимой переменной;  – теоретические значения [0;+1] количественные признаками

Частные коэффициенты корреляции ( )

[0;+1]

количественные признаками

 

Для интерпретации результатов оценки коэффициентов корреляции на практике часто используется шкала Чеддока.

Таблица 6.2 – Сила корреляционной связи по шкале Чеддока

Показания тесноты связи до ±0,3 от ±0,3 до ±0,5 от ±0,5 до ±0,7 от ±0,7 до ±0,9 от ±0,9 до ±0,99
Характеристика связи слабая умеренная заметная высокая весьма высокая

 

Знак коэффициента указывает на направление связи между исследуемыми признаками, так «-» указывает на обратную связь (рисунок 2.6(а)), а «+» указывает на прямую связь (рисунок 2.6(б)).

Если в ходе исследования значение коэффициента строго равно нулю это указывает на то, что между признаками отсутствует взаимосвязь, соответственно в случае, когда коэффициент равен ±1 взаимосвязь носит функциональный характер.

Как известно из курса эконометрики относительно формы зависимости выделяют линейную и не линейную регрессии, при этом относительно числа независимых переменных включенных в модель выделяют – парную и множественную.

Корреляционный анализ как правило дополняется регрессионным, заключающимся в построении линейных или не линейных, парных или множественных уравнений. В данной лабораторной работе остановимся на самом простом случае на линейной модели.

Множественная линейная регрессия представляет собой модель зависимости результативного признака с двумя и большим числом факторов, т. е. модель вида:

Парная линейная регрессия представляет собой частный случай множественной регрессии и есть модель между двумя переменными - у и х, т.е. имеем:

где: i =1, 2, …, n

n – объем изучаемой совокупности;

 – данные полученные в результате построения модели (теоретические уровни, модельные данные)

 – зависимая переменная;

 – независимая переменная;

 искомые (неизвестные) параметры (коэффициенты) уравнения регрессии;

 – случайная величина (возмущение, остатки, отклонения).

Основным методом решения задачи нахождения параметров  уравнения связи является метод наименьших квадратов (МНК).

Суть МНК состоит в минимизации суммы квадратов отклонений фактических значений от значений, вычисленных по уравнению связи.

 или

В случае парной линейной регрессии для нахождения необходимо решить систему нормальных уравнений:

Преобразуя предложенную систему получить следующие формулы для нахождения параметров уравнения:

и

 – не имеет экономической интерпретации, но существует мнение, что он показывает усредненное влияние всех прочих факторов, не включенных в исследование.

 – показывает, на сколько в среднем изменится величина результативного признака y при изменении факторного признака x на натуральную единицу.

Если >0 то связь прямая, если < 0 то связь обратная.

В случае множественной линейной регрессии система нормальных уравнений значительно увеличивается, так в случае двух независимых переменных имеем следующую систему:

Для ее решения относительно неизвестных параметров  можно поступить несколькими способами:

1. Использовать возможности специализированных пакетов программ (Excel, Stata, Statistica, MathCad и др.).

2. Использовать решение системы посредством матричной алгебры:

где:    

3. Использовать для нахождения параметров общий и частные определители системы.

Общий определитель системы равен:

 

Частные определители:

Решение системы может быль осуществлено методом определителей:

 ; ;

где:  - определитель системы;

 – частные определители.

Решение типовой задачи – элементарные методы выявления взаимосвязей

Проиллюстрируем алгоритм выявления наличия взаимосвязи между социально-экономическими явлениями на основе следующих данных:

Таблица 6.3 – Вариация показателей характеризующих результаты экономической деятельности промышленных предприятий

y

12,3

9,9

15,1

10,4

13,1

12,4

13,2

11,8

11,5

14,2

14,4

12,1

13,1

11,5

10,6

x1

280

210

323

221

295

271

276

284

260

310

293

239

254

240

246

x2

3,12

1,25

4,98

1,35

3,25

2,99

3,69

2,65

2,1

3,75

4,57

2,94

3,56

2,24

1,45

где: y – Чистая прибыль, млн. руб.

 – Численности промышленно-производственного персонала, чел

 – Среднегодовой стоимости основных производственных фондов, млн. руб.

Для построения корреляционного поля необходимо по оси OY отложить значения переменной y, а по оси OX отложить значения переменной .

При построении данного графика рекомендуется откладывать значения показателя не от нуля, а от минимального значения показателя, в этом случае график будет информативен. В рассматриваемом примере минимальное значение переменной y наблюдается у второго предприятия равное 9,9 млн. руб., соответственно начало отсчета необходимо начинать от значения 9. По переменной  минимальное значение равно 210 чел. соответственно откладывать необходимо от 200. 

В главном меню табличного редактора Excel выберем Вставка ® Диаграмма, в появившемся окне Мастера диаграмм выберем Точечная, в результате получим следующий график характеризующий зависимость y от .

 

Рисунок 6.7 – Корреляционное поле зависимости чистой прибыли от численности промышленно-производственного персонала

 

Согласно приведенному рисунку наблюдается рост показателя y с ростом показателя , т.е. можно предположить о наличии прямой связи между рассматриваемыми показателями.

Для реализации метода сопоставления параллельных рядов, необходимо упорядочить совокупность по переменной  в возрастающем порядке, при этом автоматически будем переносить значения по переменной y соответствующего предприятия. Для этого в главном меню выбираем Данные ® Сортировка. В появившемся окне (рисунок 6.8) указываем переменную  и нажимаем ОК.

Рисунок 6.8 – Сортировка диапазона

В результате осуществления данной процедуры получаем следующие результаты:

Рисунок 6.9 – Результаты выполнения метода сопоставления параллельных рядов

 

Результаты реализации процедуры сопоставления параллельных рядов при большом объеме совокупности (если приведены в виде таблицы) не информативны, поэтому рекомендуется приводить их в виде графика, при этом для увеличения информативности рисунка рассматриваемые данные необходимо размещать на разных осях, в нашем случае по оси OY отложим переменную y, а по оси OY 1 - . Т.е. выберем Вставка ® Диаграмма ® Мастер диаграмм ® График.

 

Рисунок 6.10 - Результаты выполнения метода сопоставления параллельных рядов

 

Результаты, отображенные на рисунке 6.10, указывают на наличие прямой связи между показателями.


Дата добавления: 2022-06-11; просмотров: 59; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!