Линейные разделяющие функции.



 

Методы, в которых границы классов строятся без каких-либо предположений о статистических свойствах сигнатур классов, называются непараметрическими. Кроме метода гиперпараллелепипедов, в ERDAS Imagine имеется еще один непараметрический метод классификации – на основе построения границ классов непосредственно в пространстве признаков. Этот метод так и называется - Feature space. Как и в предыдущем случае, технология построения таких областей требует предварительного определения положения классов в признаковом пространстве. Для этих целей удобнее всего использовать аппарат связывания изображения с проекциями признакового пространства на пары каналов. Методика такого анализа описана в [1].

В общем случае множество значений признаков для образов класса Ak - это область W(k) в пространстве X, ограниченная некоторой гиперповерхностью произвольной формы. Перекрытие областей, соответствующих различным классам, приводит к ошибкам классификации. Поэтому во всех методах классификации гиперповерхности, разделяющие множества W(k), строятся так, чтобы обеспечить тем или иным способом минимум ошибок при распределении образов по классам. Уравнения таких гиперповерхностей имеют вид d(x)=0 и называютсяразделяющими функциямиилидихотомиями.Во многих классических алгоритмах автоматического распознавания используются линейные разделяющие функции (рис.20). Области решений в пользу каждого из классов в этом случае описываются системой линейных неравенств. Например, для класса A1 на рис.19 эта система имеет вид:

 

                                     d1(x1,x2)>0,

                                                d2(x1,x2)>0,      (18)

                                                d3(x1,x2)>0.

 

 

Когда мы рисуем область-многоугольник в признаковом пространстве, мы, фактически, определяем такую систему неравенств-ограничений. Увеличивая число  неравенств, можно аппроксимировать границу с любой желаемой точностью. Интервалы классов по каналам в этом случае могут и перекрываться.

Качество выбора границ классов можно проверить, наложив «маску» эталона на изображение, как это описано в [1].

Параметрические методы классификации.

 В непараметрических методах классифицируются не все точки изображения, а только те, сигнатуры которых попадают в ограниченные нами области признакового пространства. Остальная часть признакового пространства образует области отказов от распознавания. Что же делать с такими точками?

Мы, конечно, можем отнести все эти точки в класс отказов и назвать его «прочие объекты». Однако иногда требуется сплошная классификация, то есть все пиксели должны быть куда-то отнесены. В этом случае применяются так называемые параметрические методы, в которых используются определенные предположения о характере статистического распределения сигнатур в классах и соответствующие параметры такого распределения. Как мы уже знаем, характер такого распределения, при достаточно большом количестве пикселей, можно оценить по гистограмме.

В случае нескольких каналов анализ n-мерной гистограммы напрямую не представляется возможным. Средства пакета ERDAS Imagine позволяют анализировать гистограммы выбранных классов только отдельно в каждом канале. Тем не менее, это также позволяет нам судить о том, насколько однороден класс по яркостному признаку.

В параметрических методах классификации используется предположение, что сигнатуры классов подчиняются нормальному (Гауссовому) закону распределения. Это означает, что распределение сигнатур для каждого класса можно описать вектором средних значений m и характером рассеяния точек вокруг среднего. Для многомерного нормального распределения график плотности p(x) представляет собой «гиперколокол» с максимумом  p(m). Сечения такого многомерного «колокола» параллельно плоскостям, образуемым каждой парой координат представляют собой эллипсоиды рассеяния, которые в разных направлениях имеют разные значения σ. Поэтому рассеяние вокруг среднего значения описывается ковариационной матрицей C, элементы которой определяются выражением (13) из раздела 5.3. На рис.21 показан пример таких эллипсоидов рассеяния для функций распределения спектральной яркости трех классов на диаграмме рассеяния в красном и ближнем ИК диапазонах.

Распределение сигнатур в классах по нормальному закону позволяет использовать при классификации тот факт, что с увеличением расстояния сигнатуры пикселя от точки m вероятность принадлежности пикселя к классу убывает по известному закону, и это правило выполняется для всех классов. То есть для каждой пары классов существует такая разделяющая функция, которая обеспечивает минимум ошибки при разделении этой пары.

Уравнение таких разделяющих функций d(x)ks=0 для пары классов k, s можно преобразовать к виду

d(x)ks=rk(x)-rs(x)=0,

 

 

где rk(x) – функция, для которой на области W(k) выполняется условие

 

rk(x)>rl(x) для всех l¹k, k,l=1,..., K.    

 

а неравенства, ограничивающие область решения для k-го класса, представить в виде rk(x)>rs(x) для всех s=1,…,K.

Функции rk(x) называются  решающими функциямиили дискриминантами.Если для всех классов k=1,...,K заданы решающие функции rk(x), задача классификации конкретного вектора-образа х в такой постановке сводится к вычислению значений rk(x) и нахождению :

rk(x)=  Þ  xÎ Ak.   (19)

В программных реализациях алгоритмов классификации изображений вместо решающей функции обычно используется функция, принимающая  при условии (19) минимальное значение. Она называется расстоянием или метрикой и в каждом методе функционально связана с соответствующей решающей функцией. Использование метрики вместо решающей функции позволяет унифицировать процедуру оценки качества классификации для всей группы реализованных в пакете методов. Тем более что в ряде параметрических алгоритмов расстояние непосредственно используется в качестве меры сходства образа с классом.

Простейшее из параметрических правил – классификация по минимуму расстояния. В ней используется только один параметр статистического распределения – среднее значение m (в многомерном случае – вектор средних значений). В этом случае также удобно предполагать, что яркости в классах распределены по нормальному закону, хотя эта гипотеза напрямую не используется. Векторы-образы относятся к k-му классу по минимуму евклидова расстояния до центра класса mk:

 

 Þ xÎ Ak, (i=1,…,K)

где

. (20)

    Разделяющие функции между классами при использовании в качестве меры близости евклидова расстояния (20) представляют собой гиперплоскости (линейные разделяюшие функции), перпендикулярные к линиям, соединяющим центры кластеров, и равноудаленные от этих центров. Это означает, что такой метод классификации обеспечит минимальные ошибки только в том случае, когда эллипсоиды рассеяния сигнатур классов примерно одинаковы и их форма близка к сферической. Эта ситуация встречается на изображениях, где представлены преимущественно объекты одной категории, например, травянистая растительность или почвы. Для древесно-кустарниковой растительности и, тем более, сложных комплексов, включающих растительную компоненту (например, городская застройка), это условие выполняться не будет. В таких случаях необходимо применять статистические методы классификации, которые будут рассмотрены ниже.

К параметрическим методам классификации можно условно отнести и неконтролируемую классификацию, поскольку в ней используется, по меньшей мере, один параметр статистического распределения признаков внутри каждого класса – вектор их средних значений m.

 

 


Дата добавления: 2018-05-12; просмотров: 647; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!