Тема 4.МНОГОМЕРНЫЕ МОДЕЛИ И МЕТОДЫ ИССЛЕДОВАНИЯ ПОПУЛЯЦИЙ И ЭКОСИСТЕМ



 

В экологических исследованиях и других приложениях системного анализа, как правило, решение различных проблем и разработка моделей связаны с анализом множества переменных. Такие модели называются «многомерными», и они связаны с методами, которые в совокупности именуются «многомерным анализом» – выражение, достаточно широко используемое для обозначения методов обработки данных, которые являются многомерными в том смысле, что каждый представитель (индивидуум или группа) порождает значения р переменных. Математический аппарат, основанный на многомерных нормальных распределениях, был разработан в 30-е годы прошлого столетия и методы, разработанные в то время, служат основой большинства многомерных методов, применяемых и по сей день. Как правило, вычисления, необходимые для многомерного анализа и построения многомерных моделей, довольно громоздки и зависят от количества рассматриваемых переменных (р) и требуют значительных вычислительных ресурсов. В данной главе мы рассмотрим основные многомерные модели, которые применяются в настоящее время и имеются в современных статистических пакетах для ПЭВМ с примерами для анализа биосистем.

Прежде всего эти модели можно разделить на две основные категории, а именно: модели, в которых одни случайные величины используются для предсказания значений других, и модели, где переменные одного типа и не делается попыток предсказать одно множество значений по другому. Последнюю категорию моделей, которые в целом называются описательными, можно далее подразделить на модели, у которых все входы количественные и которые используют анализ главных компонент и кластерный анализ, и модели, у которых, по крайней мере, некоторые из входов не количественные, а качественные. Для последних больше подходит модель взаимного осреднения. Прогностические модели, в свою очередь, могут быть подразделены по числу предсказываемых случайных величин, а затем по тому, являются ли все прогнозы количественными. Если предсказывается несколько величин, наиболее приемлемой оказывается модель канонического анализа. Если же предсказываемая величина только одна и a priori имеется две группы индивидов, наиболее подходящей из имеющихся моделей оказывается модель дискриминантного анализа, в то время как более чем для двух априорных групп индивидов наиболее плодотворным оказывается подход, основанный на применении канонических переменных, хотя это и не исключает использование попарных дискриминантных функций.

 

Линейный корреляционный анализ

 

Корреляционный анализ – один из методов исследования взаимосвязи между двумя или более переменными. Многие многомерные модели основаны на анализе корреляционных или связанных с ними ковариационных таблиц, построенных для множества переменных.

Термин «корреляция», буквально означающий «соотношение» или «взаимосвязь», имеет следующий смысл: корреляция есть наличие взаимной согласованности в изменчивости двух или нескольких признаков, явлений. Корреляционный анализ изучает сопряженную изменчивость двух или нескольких признаков. Работа по проведению корреляционного анализа начинается с построения корреляционных решеток (табл. 4.1). Пусть имеется выборка наблюдений (х, у) из популяции W. Причем х и у – случайные величины. Корреляционная решетка для двух переменных (признаков) представляет собой таблицу из m×к клеток, где m и к – число значений признаков х и у. Значения признаков удобно располагать в возрастающем порядке слева направо для х и сверху вниз для у. В клетках таблицы производят разноску сопряженных частот fxy (число наблюдений со значениями признаков х и у) в зависимости от значений двух признаков одновременно.

Таблица 4.1.– Схема корреляционной решетки

х У Х1 Х2 Х3 Хk fy
Y1 Y2 Y3 … ym F11 F21 F31 Fm1 F12 F22 F32 Fm2 F13 F23 F33 Fm3 … … … … F1k F2k F3k Fmk Fy1 Fy2 Fy3 Fym
fx Fx1 Fx2 Fx3 Fxk n

fx , ,fy – частоты вариационных рядов,fij– сопряженные частоты,
n– объем выборки, х, у – значения признаков:

(4.1)

(4.2)

(4.3)

Для расчета коэффициента корреляции необходимо предварительно рассчитать некоторые статистики (средние значения, дисперсию, среднеквадратичное отклонение, корреляционный момент) по следующим формулам:

– средние (4.4)

– дисперсии (4.5)

– среднеквадратичные отклонения (4.6)

, (4.7)

mxy – корреляционный момент.

Для удобства расчетов рекомендуется заполнить табл. 4.2

 

Таблица 4.2.– Таблица для расчета коэффициента линейной корреляции

Х у Х1 Х2 Хк fyi fyiyi Y2i*fyi
Y1 f11 f12 f1k          
Y2 f21 f22 f2k          
         
ym fm1 fm2 fmk          
fxj                  
fxj · xj                  
                 
fxj · x2j                  
                 

 

Коэффициент линейной корреляции рассчитывается по формулам:

(4.8)

или . (4.9)

Вычисления по второй формуле более громоздки, т.к. отклонения от средней находятся для каждой сопряженной частоты.

Значение коэффициента корреляции заключено в пределах от -1 до 1. Положительное значение коэффициента указывает, что У имеет тенденцию возрастать совместно сХ, отрицательное наоборот – Ууменьшается с возрастаниемХ. Экстремальное значение (-1 или +1) соответствует полной линейной зависимости между Х и У. Чем ближе коэффициент корреляции к 1, тем ближе зависимость к линейной.

 


Дата добавления: 2018-04-15; просмотров: 570; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!