Коэффициенты автокорреляции и кросс-корреляции



Оглавление

 

Глава 1. Корреляционный анализ в системе Statistica…...………... 4
1.1. Введение в корреляционный анализ………………………………… 4
1.2. Парные, частные и множественные коэффициенты корреляции…. 7
1.3. Автокорреляция и кросс-корреляция……………………………….. 14
Глава 2. Проведение множественного регрессионного анализа в системе Statistica………………………………..…………... 16
2.1. Введение………………………………………………………………. 16
2.2. Стартовая панель модуля Multiple Regression (множественная регрессия). Задание входных параметров………………………….. 17
2.3. Вывод результатов и их анализ……………………………………… 20
Глава 3. Примеры решения практических задач…………………... 25
3.1. Регрессионная модель расходов на образование при гетероскедастичности остатков……………………………………. 25
3.2. Применение теста Голдфелда-Квандта для обнаружения гетероскедастичноси………………………………………………… 28
Глава 4. Варианты заданий для самостоятельных компьютерных исследований…………………………………………………… 30
Список рекомендуемой литературы………………………………….. 37

 


1. Корреляционный анализ в системе “STATISTICA”

Введение в корреляционный анализ

 

Корреляционный анализ является одним из методов статистического анализа взаимозависимости нескольких признаков.

Основная задача корреляционного анализа состоит в оценке корреляционной матрицы генеральной совокупности по выборке и определении на основе этой матрицы частных и множественных коэффициентов корреляции и детерминации.

Рассмотрим виды корреляционной связи.

1)  Относительно числа переменных, включенных в корреляционную модель, различают:

q парную корреляцию – характеризует тесноту линейной связи между двумя переменными на фоне действия всех остальных показателей, входящих в модель, изменяется в пределах от –1 до +1;

q частную корреляцию – характеризует тесноту линейной зависимости между двумя переменными при исключении влияния всех остальных показателей, входящих в модель, изменяется в пределах от –1 до +1;

q множественную корреляцию – характеризует тесноту линейной связи между одной переменной (результативной) и остальными, входящими в модель, изменяется в пределах от 0 до 1.

2) Относительно характера корреляционной связи различают:

q положительную корреляцию (коэффициент корреляции больше нуля), когда с увеличением (уменьшением) значений одной переменной другая имеет тенденцию увеличиваться (уменьшаться);

q отрицательную корреляцию (коэффициент корреляции меньше нуля), т.е. такую, при которой с увеличением (уменьшением) значений одной переменной другая имеет тенденцию к уменьшению (увеличению).

3) По форме связи различают:

q линейную корреляцию, когда взаимосвязь между переменными характеризуется линейными соотношениями;

q нелинейную корреляцию, при которой между переменными существуют нелинейные соотношения.

Теснота связи количественно выражается величиной коэффициентов корреляции. Коэффициенты корреляции, представляя количественную характеристику тесноты связи между признаками.

 Качественные характеристики степени тесноты связи, используемые при достаточно большом объеме наблюдений, представлены в таблице 1.1.

Оценки тесноты связи коэффициентов корреляции

Таблица 1.1

Величина коэффициентов корреляции Характер связи
до |0,3| Практически отсутствует
от |0,3| до |0,5| Слабая
от |0,5| до |0,7| Умеренная
от |0,7| до | 1 | Сильная

 

Квадрат множественного коэффициента корреляции называется множественным коэффициентом детерминации. Он характеризует долю дисперсии одной переменной (результативной), обусловленной влиянием всех остальных переменных (аргументов), входящих в модель.

Исходной для анализа является матрица X размерности (n´k), элементы которой представляют собой n наблюдений для каждого их k факторов. В корреляционном анализе матрицу X рассматривают как выборку объема n из k-мерной генеральной совокупности, подчиняющейся k-мерному нормальному закону распределения.

По выборке определяют оценки параметров генеральной совокупности: - вектор средних; S – вектор средних квадратических отклонений и корреляционную матрицу R, которая является симметрической и положительно определённой, размерности (k´k).

 

где:                 

xijзначение i-го наблюдения j-го фактора;

ril – выборочный парный коэффициент корреляции, характеризующий тесноту линейной связи между показателями xj и xl . При этом ril является оценкой генерального парного коэффициента корреляции.

Матрица R, которая является симметрической (ril= rli) и положительно определённой, размерности (k´k).

Кроме того, находятся точечные оценки частных и множественных коэффициентов корреляции любого порядка. Например, частный коэффициент корреляции (k-2)-го порядка между переменными x1 и x2 равен

где |R| определитель матрицы R.

Значимость частных и парных коэффициентов корреляции, т.е. гипотезы H0 : r=0, проверяется по t-критерию Стьюдента. Наблюдаемое значение критерия находиться по формуле

где r-соответственно оценка частного или парного коэффициента корреляции r; l – порядок частного коэффициента корреляции, т.е. число фиксируемых факторов (для парного коэффициента корреляции l=0).

Проверяемый коэффициент корреляции считается значимым, т.е. гипотеза H0 : r=0 отвергается с вероятностью ошибки a, если tнабл по модулю будет больше, чем значение tкр , определяемое по таблицам t-распределения для заданного a и n=n-l-2.

Значимость множественного коэффициента корреляции (или его квадрата – коэффициента детерминации) проверяется по F-критерию. Проверка значимости, для множественного коэффициента корреляции, сводится к проверке гипотезы, что генеральный множественный коэффициент корреляции равен нулю, т.е. H0 : r1/2,…,k=0, а наблюдаемое значение статистики находиться по формуле

Множественный коэффициент корреляции считается значимым, т.е. имеет место линейная статистическая зависимость между x1 и остальными факторами х2,.., xk , если Fнабл>Fкр , где Fкр определяется по таблице F-распределения для заданных a и n1=k-1, n2=n-k.

Коэффициенты автокорреляции и кросс-корреляции

При работе с временными рядами, при анализе качества, адекватности выбранных моделей часто используется коэффициенты автокорреляции и кросс-корреляции.

Коэффициенты автокорреляции представляют собой описанные выше парные и частные коэффициенты корреляции, рассчитанные между одним признаком и им же, но с определенным сдвигом (лагом). Например, если лаг равен 1, то в расчете одному значению признака будет соответствовать значение того же признака, но относящееся к предыдущему наблюдению. Кросс-корреляция рассчитывается для двух переменных, одна из которых берется с определенным запаздыванием.

Таким образом, формулы для расчета коэффициентов и проверки их значимости могут быть получены из формул приведенных выше.


Дата добавления: 2018-02-28; просмотров: 2594; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!