Расчет величины коэффициента наследуемости в широком смысле при селекционной оценке популяций методом дисперсионного анализа



Методические разработки проведения практических занятий магистров

по направлению подготовки 35.04.01 – Лесное дело

профилю подготовки – лесные культуры, селекция, семеноводство

с элементами УИРМ по дисциплине

«Б1.В.ДВ.2 Методология научной деятельности в лесном деле»

 

Занятие № 6 (Редакция 17.09.2021 г.)

 

 

Тема: «Исследование алгоритма проведения однофакторного дисперсионного анализа»

 

Ключевые слова: дисперсия, факториальная дисперсия, сумма квадратов отклонений, дисперсионное отношение, критерий Фишера.

 

Бюджет времени – 2 часа.

Количество двухчасовых занятий – 1.

Распределение бюджета времени:

- 1 час на освоение теоретических основ и принципов определения оценок наследственно обусловленной части эффекта отбора;

- 1 час на расчеты оценок селекционного дифференциала в электронных таблицах Microsoft Excel.

 

Дидактический материал, необходимый для проведения данной лабораторной работы, приведен в файле Excel – «НСР» (Приложение – 2).

 

 

Преамбула: теоретическая платформа дисперсионного анализа

 

Основное назначение дисперсионного анализа – это разлагать общую изменчивость признака на изменчивость частную, возникающую у членов популяции (совокупности) под влиянием многообразных факторов. В ходе анализа устанавливают:

- долю изменчивости, обусловленную каждым учитываемым в опыте фактором,

- долю изменчивости, вызванную совместным действием этих факторов,

- а также выявляют ту долю изменчивости, которая является результатом воздействия многих не учтенных в опыте факторов, что образует так называемую случайную, или остаточную, изменчивость признака.

 

Указанное свойство дисперсионного анализа имеет большое значение при анализе изменчивости, наблюдаемой у биологических объектов, в том числе и у древесных растений и кустарников. В настоящее время хорошо известно и является общепризнанным положением то, что варьирование признаков у растений обусловлено действием многообразных факторов. Часть из них, оказывая влияние на признак, изменяет его в сторону увеличения, а другие факторы приводят к уменьшению данного признака. Совместное действие факторов также вносит какое-то дополнительное влияние на формирование и развитие признака и, следовательно, создает дополнительный источник его изменчивости.

 

В результате такого многообразного воздействия на признак со стороны комплекса факторов внешней и внутренней среды (а точнее – факторов внешней среды и внутренних биологических особенностей организма) возникает варьирование признака у членов популяции. В этом варьировании отражается интегрированное, суммарное действие всех раздельно и совместно действующих факторов. С этой конечной общей (результирующей) изменчивостью мы и имеем дело при изучении любой совокупности объектов, в которой влияние каждого отдельного фактора заслоняется – нивелируется – действием всех остальных факторов. Для познания закономерностей изменчивости объектов какой-либо совокупности важно вычленить долю влияния отдельных факторов, изучение действия которых на данные объекты может служить целью специальных опытов. Обрабатывая опытный материал дисперсионным методом, можно получить математическое выражение и определить величину изменчивости, обусловленной воздействием учтенных в опыте факторов, и изменчивость остаточную, возникшую под влиянием всех других, не учтенных в опыте, факторов. В этом состоит первое и наиболее важное свойство дисперсионного анализа.

 

Второе свойство дисперсионного анализа заключается в том, что он позволяет определить статистическую достоверность доли влияния изучаемых факторов. Важной особенностью дисперсионного метода является то, что его можно применять на разных типах выборок (больших и малых) и, что особенно важно, он позволяет обрабатывать совокупности, включающие в себя разнородный материал: разнополые особи у двудомных растений (тополя, ивы, облепиха и др.); совокупности, состоящие из групп особей растений разного генетического происхождения (особи из естественных насаждений, гибриды, сорта и т.п.). При этом дисперсионный анализ является методом анализа количественной информации (преимущественно).

 

При проведении дисперсионного анализа исходят из предположения о том, что некоторая совокупность объектов под действием какого-либо фактора (или нескольких факторов) разделяется на несколько (две и более) групп. При этом каждая из групп объектов отличается от других групп величиной среднего группового значения признака и характером его изменчивости – дисперсией или вариансой (вариансный анализ) в пределах группы. Учитывается также и то, что изменчивость признака у объектов возможна как внутри таких групп, так и между ними.

 

Если в имеющейся совокупности объектов изменчивость (рассеянье, дисперсия) признака в любой из её частей одинакова, то совокупность не разделена на группы. Такая совокупность признается однородной. Это единая совокупность, а по своим характеристикам – одно и то же. Если же разные части анализируемой совокупности характеризуются разными дисперсиями – разным характером рассеянья признака – то совокупность не рассматривается как единая, и в её составе признается наличие некоторых внутренних групп. Разделение совокупности на части происходит под действием какого-либо фактора. Например, мы рукой можем разделить равномерно рассыпанные на столе шишки сосны или ели на группы (части совокупности). Выявлению его влияния и подчинен дисперсионный анализ. На разные по своим характеристикам группы могут быть разделены сеянцы, выращиваемые на разном субстрате, при разном режиме внесения удобрений или орошения и т.п. На различающиеся между собой группы объектов могут быть разделены деревья в лесу, произрастающие в разных типах ЛРУ, разных типах леса и т.п. Разными группами объектов могут явиться семена, заготовленные с разных по происхождению (генотипу) деревьев. Сеянцы, выращиваемые в разных теплицах в ГБУ НО «Семеновский спецсемлесхоз», как совокупность в целом, разделены при этом на группы по принадлежности к той или иной теплице. Таких примеров можно привести много.

 

Если уровень изменчивости признака, оцениваемой величиной дисперсии (среднего квадрата отклонений), между группами больше, чем его изменчивость внутри групп, то факт наличия различий между группами принимается установленным, а сами различия между группами признаются существенными. Если же уровень различий между группами соответствует уровню различий внутри групп (случайное варьирование, не вызванное действием анализируемого фактора), то действие фактора признается неэффективным, не приводящим к разделению общей рассматриваемой совокупности (дисперсионного комплекса) на реально существующие группы (классы или подсовокупности).

 

Организованными факторами в дисперсионном анализе выступают те факторы, действие которых признается (принимается) доступным для изучения, собственно те факторы, которые вызывают разделение совокупности на части, которые организованы в ту или иную систему (той или иной системной организации). Частным случаем такой организации групп является иерархическая система. В ней одни группы имеют более высокий ранг организации, и сами содержат в своем составе меньшие по своей численности группы, относящиеся к группам низшего ранга организации. Такие совокупности складываются под действием комплекса взаимосвязанных факторов, между которыми существует соподчиненность, формирующая их иерархию.

 

В этой связи необходимым условием эффективного использования метода является правильная организация дисперсионных комплексов.

 

Следует учитывать логику и структуру естественной группировки членов выборки (деревьев в лесу или на опытном участке) при выделении градаций и классов в дисперсионных комплексах, что имеет место в отношении количественных признаков.

 

Следует избегать или сводить к минимуму применение таких схем расчета, при которых дисперсионные комплексы (основа статистической обработки) искусственно строятся в виде чередующихся классов, границы которых устанавливаются самим исследователем.

 

Необходимо сравнивать (сопоставлять, изучать) между собой такие группы объектов в составе какой-либо изучаемой совокупности, которые возникли (сложились, сформировались) вследствие (по причине) воздействия на неё (совокупность) известного исследователю фактора или множества факторов, действие которого и подвергается анализу. Здесь в задачу исследователя входит установление существенности различий между сравниваемыми группами совокупности, возникшими под действием фактора, но не (произвольное) субъективное определение границ таких групп и произвольное утверждение собственно факта наличия таких групп.

 

Целесообразно принимать исходную посылку (позицию, базу) дисперсионного анализа как предположение, как выдвижение рабочей гипотезы о наличии в составе некоторой исходной совокупности групп объектов с границами, оформленными в той или иной степени. Само возникновение таких групп рассматривается как результат воздействия на совокупность некоторых факторов. Выдвижение так называемой «нулевой гипотезы» предполагает отсутствие между сравниваемыми группами различий, уровень которых превышал бы уровень случайных различий, возникающих в совокупности независимо от действия (или без такового) какого-либо направленного фактора. То есть различий между группами не существует, и, следовательно, не существует собственно групп в составе совокупности – совокупность однородна по своему составу и строению и не дифференцирована на внутренние части.

 

Оценка изменчивости дается по величине дисперсий. по этой причине в совокупности формально предполагается наличие как минимум двух групп объектов, а численность каждой из групп – два и более объектов. Кроме того, предполагается различие в значениях признаков, как в группах, так и между ними. Именно в такой ситуации возможен расчет дисперсий как оценок степени разброса или рассеянья значений признака объектов относительно среднего. По соотношению величин дисперсий судят о том: превышает ли уровень изменчивости признаков между видимыми группами объектов уровень изменчивости, соответствующий уровню изменчивости объектов в пределах групп, или соответствует такому уровню случайной изменчивости.

 

Сами дисперсии рассчитываются с помощью следующих сумм квадратов отклонений по нижеприведенным формулам:

 

Cy = ( Vi - Mo )2 – сумма квадратов отклонений отдельных вариант всего комплекса наблюдений ( Vi ) от их общей средней о) – для расчета общей дисперсии (SSy – sum square);

 

Cx = ( Mx i – Mo )2 – сумма квадратов отклонений групповых или частных средних х i ) от общей для всего комплекса средней о) – для расчета частной или факториальной дисперсии (SSx – sum square);

 

Cz = ( Vi – Mxi )2 – сумма по всем группам сумм квадратов отклонений отдельных вариант ( Vi ) в пределах группы от их групповых средних х i ) для расчета случайной или остаточной дисперсии (SSz – sum square).

 

При этом справедливо равенство:

 

Cy = Cx + Cz

 

В несколько иной форме это основное равенство можно представить в виде (1):

, где                                    (1)

 

 - отдельный вариант (дата);

 - общее среднее для всего комплекса;

 - частное (групповое) среднее;

 - общее число отдельных вариант в пределах всего комплекса, N = n1

   n2 + n3 + … + na , в случае равенства численностей групп N = n*a;

j - частное число вариант в пределах отдельной a-той группы, в случае   

   равенства численностей всех групп (равномерные комплексы)

   n1 = n2 = n3 = … = na = n;

 - число групп в комплексе.

 

 

Это основная формула дисперсионного анализа. Вместе с тем в ней возможно разложение факториальной дисперсии на ряд дисперсий каждого из факторов и дисперсии, определяемой взаимодействием учитываемых факторов, в случае если таких факторов много (более одного). Когда учитывается влияние нескольких факторов, они могут быть как независимыми один от другого, так и зависимыми (взаимосвязанными). В последнем случае говорят об иерархическом дисперсионном анализе на том основании, что взаимозависимые факторы образуют некую систему соподчиненности – т.е. иерархию.

 

ПРИМЕР.

Учесть влияние различий в происхождении растений, составляющих какую-либо филогенетическую систему, на проявление их признаков (размеры или энергия прорастания семян) можно следующим образом. Для сосны обыкновенной может быть учтено: принадлежность к какому-либо экотипу или подвиду (сосна кулундинская) – первый уровень градации фактора; принадлежность к той или иной популяции – второй уровень градации фактора, который в свою очередь зависим от первого фактора. В пределах второго уровня градации фактора учитываются различия между особями популяции. Возможна и более сложная система иерархии: семейство сосновых, в его составе род сосна сравнивается с другими родами (ель, лиственница, пихта), в составе каждого рода различные виды, в составе видов внутривидовые таксоны и в конечном итоге популяции и особи, составляющие их.

 

ДОПОЛНЕНИЕ.

Важным этапом дисперсионного анализа является определение средних квадратов отклонений или, как их иногда называют, дисперсий. Они представляют собой отношение сумм квадратов отклонений (общей, факториальной или факториальных и остаточной) к соответствующим числам степеней свободы.

 

ВНИМАНИЕ!

Отношение факториальной дисперсии к остаточной дисперсии при условии, что факториальная дисперсия больше или равна остаточной, называется дисперсионным отношением или критерием Фишера. По его величине, соотнесенной с табличным значением, судят об эффективности действия фактора (например, фактора А). В случае, когда остаточная дисперсия больше факториальной, допускается расчет дисперсионного отношения как отношения остаточной дисперсии к факториальной (Лакин, 1980; стр. 219 – 222). Название статистики – «критерий Фишера» предложено Дж. У. Снедекором в честь своего учителя Р.А. Фишера.

 

ВНИМАНИЕ!

При определении силы влияния фактора (факторов) как отношения «исправленных» дисперсий факторов к общей дисперсии в состав общей дисперсии не включаются дисперсии факторов, не имеющих достоверного влияния. То есть в этом случае общая дисперсия является суммой только дисперсий факторов с достоверным влиянием и остаточной дисперсии.

 

Сфера применения дисперсионного анализа достаточно широка, что обусловлено его свойствами, но особенно важен он в селекционных и генетических исследованиях. Оценка одного из важнейших показателей в селекции древесных видов – коэффициента наследуемости признака в широком смысле (h 2) – основана на результатах дисперсионного анализа. В генетических работах дисперсионный анализ используется для подтверждения или отрицания нулевой гипотезы о наличии или отсутствии наследования признаков. В процессе дисперсионного анализа можно получить сведения о криволинейности связей и её величине.

 

 

Расчет величины коэффициента наследуемости в широком смысле при селекционной оценке популяций методом дисперсионного анализа

 

 

Общая постановка задачи

Пусть требуется рассчитать величину коэффициента наследуемости в широком смысле для оценки наследуемости (в широком смысле) признаков какого-либо вида древесных или кустарниковых растений по предложенному дидактическому материалу (дидактический материал представлен таблицами исходных данных, файлами электронных таблиц Excel).


Дата добавления: 2021-12-10; просмотров: 24; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!