Тема 4.МНОГОМЕРНЫЕ МОДЕЛИ И МЕТОДЫ ИССЛЕДОВАНИЯ ПОПУЛЯЦИЙ И ЭКОСИСТЕМ

⇐ ПредыдущаяСтр 7 из 14Следующая ⇒

В экологических исследованиях и других приложениях системного анализа, как правило, решение различных проблем и разработка моделей связаны с анализом множества переменных. Такие модели называются «многомерными», и они связаны с методами, которые в совокупности именуются «многомерным анализом» – выражение, достаточно широко используемое для обозначения методов обработки данных, которые являются многомерными в том смысле, что каждый представитель (индивидуум или группа) порождает значения р переменных. Математический аппарат, основанный на многомерных нормальных распределениях, был разработан в 30-е годы прошлого столетия и методы, разработанные в то время, служат основой большинства многомерных методов, применяемых и по сей день. Как правило, вычисления, необходимые для многомерного анализа и построения многомерных моделей, довольно громоздки и зависят от количества рассматриваемых переменных (р) и требуют значительных вычислительных ресурсов. В данной главе мы рассмотрим основные многомерные модели, которые применяются в настоящее время и имеются в современных статистических пакетах для ПЭВМ с примерами для анализа биосистем.

Прежде всего эти модели можно разделить на две основные категории, а именно: модели, в которых одни случайные величины используются для предсказания значений других, и модели, где переменные одного типа и не делается попыток предсказать одно множество значений по другому. Последнюю категорию моделей, которые в целом называются описательными, можно далее подразделить на модели, у которых все входы количественные и которые используют анализ главных компонент и кластерный анализ, и модели, у которых, по крайней мере, некоторые из входов не количественные, а качественные. Для последних больше подходит модель взаимного осреднения. Прогностические модели, в свою очередь, могут быть подразделены по числу предсказываемых случайных величин, а затем по тому, являются ли все прогнозы количественными. Если предсказывается несколько величин, наиболее приемлемой оказывается модель канонического анализа. Если же предсказываемая величина только одна и a priori имеется две группы индивидов, наиболее подходящей из имеющихся моделей оказывается модель дискриминантного анализа, в то время как более чем для двух априорных групп индивидов наиболее плодотворным оказывается подход, основанный на применении канонических переменных, хотя это и не исключает использование попарных дискриминантных функций.

Линейный корреляционный анализ

Корреляционный анализ – один из методов исследования взаимосвязи между двумя или более переменными. Многие многомерные модели основаны на анализе корреляционных или связанных с ними ковариационных таблиц, построенных для множества переменных.

Термин «корреляция», буквально означающий «соотношение» или «взаимосвязь», имеет следующий смысл: корреляция есть наличие взаимной согласованности в изменчивости двух или нескольких признаков, явлений. Корреляционный анализ изучает сопряженную изменчивость двух или нескольких признаков. Работа по проведению корреляционного анализа начинается с построения корреляционных решеток (табл. 4.1). Пусть имеется выборка наблюдений (х, у) из популяции W. Причем х и у – случайные величины. Корреляционная решетка для двух переменных (признаков) представляет собой таблицу из m×к клеток, где m и к – число значений признаков х и у. Значения признаков удобно располагать в возрастающем порядке слева направо для х и сверху вниз для у. В клетках таблицы производят разноску сопряженных частот f_xy (число наблюдений со значениями признаков х и у) в зависимости от значений двух признаков одновременно.

Таблица 4.1.– Схема корреляционной решетки

х У	Х₁	Х₂	Х₃	…	Х_k	f_y
Y₁Y₂Y₃… y_m	F₁₁F₂₁F₃₁F_m₁	F₁₂F₂₂F₃₂F_m₂	F₁₃F₂₃F₃₃F_m₃	… … … …	F₁_k F₂_k F₃_k F_mk	F_y₁F_y₂F_y₃F_ym
f_x	F_x₁	F_x₂	F_x₃	…	F_xk	n

f_x,_,f_y – частоты вариационных рядов,f_ij– сопряженные частоты,
n– объем выборки, х, у – значения признаков:

(4.1)

(4.2)

(4.3)

Для расчета коэффициента корреляции необходимо предварительно рассчитать некоторые статистики (средние значения, дисперсию, среднеквадратичное отклонение, корреляционный момент) по следующим формулам:

– средние (4.4)

– дисперсии (4.5)

– среднеквадратичные отклонения (4.6)

, (4.7)

m_xy – корреляционный момент.

Для удобства расчетов рекомендуется заполнить табл. 4.2

Таблица 4.2.– Таблица для расчета коэффициента линейной корреляции

Х у	Х₁	Х₂	…	Х_к	f_yi	f_yiy_i	Y²_i*f_yi
Y₁	f₁₁	f₁₂	…	f₁_k
Y₂	f₂₁	f₂₂	…	f₂_k
…	…	…	…	…
y_m	f_m₁	f_m₂	…	f_mk
f_xj
f_xj · x_j

f_xj · x²_j

Коэффициент линейной корреляции рассчитывается по формулам:

(4.8)

или . (4.9)

Вычисления по второй формуле более громоздки, т.к. отклонения от средней находятся для каждой сопряженной частоты.

Значение коэффициента корреляции заключено в пределах от -1 до 1. Положительное значение коэффициента указывает, что У имеет тенденцию возрастать совместно сХ, отрицательное наоборот – Ууменьшается с возрастаниемХ. Экстремальное значение (-1 или +1) соответствует полной линейной зависимости между Х и У. Чем ближе коэффициент корреляции к 1, тем ближе зависимость к линейной.

Дата добавления: 2018-04-15; просмотров: 570; Мы поможем в написании вашей работы!

Поделиться с друзьями:

⇐ Предыдущая 2 3 4 5 678 9 10 11 Следующая ⇒

Мы поможем в написании ваших работ!