Анализ главных компонент. Математические основы и практическое использование.



 

Анализ главных компонент (principal components - PC) в пакетах тематической обработки относится к средствам анализа многозональных (мультиспектральных) изображений. При визуально-интерактивном дешифрировании он используется для снижения размерности изображения, что, безусловно, упрощает интерактивный анализ сцены. Однако в основе преобразования лежит та самая математическая модель, на которой основаны процедуры автоматической классификации многозональных (мультиспектральных) изображений. Поэтому рассмотрим данную задачу более подробно.

    На многозональных изображениях каждый пиксель описывается n-мерным вектором яркостей

,          (9)

где n – число спектральных диапазонов (каналов) многозонального изображения. Таким образом, здесь мы переходим от координат X,Y плоскости изображения к яркостным координатам, которые задают так называемое пространство яркостных признаков или просто пространство признаков - ПП (по-английски Feature Space). Множество точек, соответствующих векторам яркостей всех пикселей образуют в этом пространстве область статистического рассеяния. Эта область в пакетах тематической обработки представляется диаграммой рассеяния в проекциях на плоскости, образуемых каждой парой яркостных координат.       

В пакете ERDAS Imagine по цветному представлению диаграммы рассеяния можно анализировать статистическое распределение яркостей на паре каналов. Двумерная гистограмма отображается на диаграмме рассеяния подобно тому, как на картах отображается рельеф местности. Для этого используется цветовая шкала «радуга». Красным цветом отображается максимальное количество точек с соответствующими значениями яркости (пики двумерной гистограммы), фиолетовым – минимальное количество точек.

    Преобразование пространства яркостей к главным компонентам – это переход от исходной системы координат (набора каналов) к новому ортогональному базису. При этом первые (главные) векторы нового базиса соответствуют направлениям наибольшего разброса точек в диаграмме рассеяния и располагаются в порядке убывания дисперсии. Таким образом, векторы базиса в новой системе координат представляют собой некоторые линейные комбинации каналов.

Смысл метода применительно к задаче улучшения визуального восприятия практически тот же, что и у процедур поднятия контраста. Однако сама математическая задача имеет более широкую область применения, причем не только при анализе видеоданных.

Метод главных компонент является задачей факторного анализа, который, в свою очередь, основывается на методологии корреляционного анализа статистических данных [13]. Задачи корреляционного и факторного анализа появились значительно раньше методологии автоматизированной обработки космических изображений. Этот аппарат используется в экспериментальных исследованиях для выявления взаимосвязей между измеряемыми параметрами и построения признаков-факторов, наиболее полно отображающих изучаемые процессы. Часто эта процедура выполняется с целью снижения размерности задачи, поскольку новые «факторы» являются линейной комбинацией исходных параметров. Отсюда и название «факторный анализ».

Общая постановка задачи факторного анализа. Пусть у нас есть n измеренных параметров, образующих в пространстве измерений базис x1,x2,...,xn. Требуется выбрать новый базис размерности m<n, состоящий из наиболее значимых факторов f1,f2,...,fm.

Поскольку в новом базисе исходные параметры будут, в свою очередь, представлены линейными комбинациями m новых факторов, решение задачи факторного анализа ищется из системы линейных уравнений вида

xj= akjfk+xj, j=1,...,n. (10)

    В модели главных компонент для искомых векторов нового базиса должно выполняться условие ортогональности: (fk,fl)=0, при k¹l.   

    Коэффициенты akj называются факторными нагрузками, а свободный член xj - характерным фактором. Он характеризует потерю информации, неизбежно возникающую при сокращении размерности. Решение задачи ищется методом наименьших квадратов относительно характерных факторов, то есть из условия:

.   (11)        

В [13] показано, что решение данной задачи сводится к нахождению собственных чисел и собственных векторов матрицы R={rij}, где rijкоэффициент корреляции между i-м и j-м исходными параметрами, где собственные числа упорядочены в порядке убывания.

Корреляционная мера и корреляционная матрица. Корреляционная мера сходства двух векторов a и b (коэффициент корреляции) определяется как косинус угла между этими векторами:

r(a,b)=(a,b)/(||a||×||b||), (10)

где (a,b)- скалярное произведение векторов, ||×|| - норма (длина) вектора.

Ясно, что величина r может принимать значения от -1 до 1 и обращается в 0, если a и b ортогональны. При a=b r(a,b)=1, при a=-b  r(a,b)=-1. В последнем случае говорят о строгой отрицательной корреляции. 

Если векторы a и b – это базисные векторы xi и xj пространства признаков многозонального изображения, то r(a,b)=rij является мерой корреляции между i-м и j-м каналами. Сильная корреляция между каналами проявляется в том, что изображения в этих двух каналах практически одинаковы. Проекция диаграммы рассеяния в пространстве признаков на такую пару каналов сильно вытянута в каком-то определенном направлении (рис.8). Чем уже такая диаграмма рассеяния, тем меньше различий между изображениями в данных каналах.

Нетрудно догадаться, что корреляционная связь между каналами зависит от характера диаграммы статистического рассеяния конкретного изображения, следовательно, от спектральных яркостных характеристик присутствующих на изображении объектов. То есть для различных сцен и даже их участков корреляция между каналами будет различной, что необходимо учитывать при выполнении преобразования к главным компонентам.

 

Рассмотрим, как строится матрица корреляции.

Пусть на изображении имеется N объектов, каждый из которых характеризуется конкретным набором значений параметров (т.е. яркостей) (xi1,xi2,…,xin), i=1,…,N. Если каждый из этих наборов представить строкой таблицы X, то столбцы такой таблицы будут представлять собой векторы измерений в N-мерном пространстве выбранных объектов по каждому каналу. В этом случае меру корреляционной связи между j-м и k-м параметрами можно рассматривать как косинус угла между векторами xj и xk в этом «пространстве объектов». Начало координат такого пространства определяется вектором m средних значений по каждому j-му измерению (j=1,…,n):

  (11) .

Коэффициент корреляции между j-м и k-м параметрами в соответствии с определением (10) имеет вид

 (12).

Числитель этого выражения – скалярное произведение векторов (xjmj) и (xk-mk) в статистическом анализе называют ковариацией. Ковариацию нормируют на N - число элементов статистической выборки:

 

 (13).

 

Матрица C={sjk} размерности n´n (j=1,…,n; k=1,…,n) называется ковариационной матрицей или матрицей статистического рассеяния.След матрицы C (сумма диагональных элементов) – это средний квадрат расстояний элементов выборки до центра m, который называют выборочной дисперсией. Соответственно, средняя величина разброса (среднеквадратичное отклонение) по j-му параметру определяется как

 (14).

 

    Использование непосредственно значений ковариации при оценках статистической взаимосвязи не слишком удобно, так как ее величина зависит от единиц измерения параметров. Поэтому ковариацию чаще нормируют на значения среднеквадратических отклонений sj и sk. В полученной таким образом корреляционной матрице R, состоящей из элементов rjk (12), по диагонали стоят единицы. Заметим также, что sjk=skj и, соответственно, rjk=rkj. Если rjk=rkj=0, то говорят, что параметры xj и xk  статистически независимы, что соответствует условию их ортогональности.

    В некоторых случаях для преобразования к главным компонентам, в частности, при анализе многозональных изображений, используют и непосредственно ковариационную матрицу, без нормировки. В пакете тематической обработки ENVI этот выбор предоставляется аналитику данных.

    Таким образом, метод главных компонент позволяет перейти к новой системе статистически независимых параметров, в которой корреляционная матрица R диагональна. Решение задачи, в конечном итоге, сводится к решению уравнения

R=lI,

где I – единичная матрица, а собственные числа (по-английски eigenvalues) lj, j=1,…,n располагаются в порядке убывания их значений. Эти значения определяют дисперсии статистического рассеяния набора из N векторов x,соответствующихтестовым объектам, в направлениях, задаваемых векторами нового базиса. Если целью преобразования является сокращение размерности задачи, выбирают первые m векторов нового базиса, отбрасывая направления с малой дисперсией как малоинформативные.

    В некоторых учебниках и монографиях, например, в [6,8], преобразование к главным компонентам называется разложением Карунена-Лоэвапо произвольной системе ортогональных функций.

При обработке многозональных изображений, однако, может оказаться, что ценная для тематической задачи информация содержится как раз в направлениях с меньшей дисперсией. Поэтому для визуально-интерактивного анализа преобразование к главным компонентам имеет еще одно важное значение. Конечно, в направлении наибольшего разброса, то есть в самой первой компоненте, будет наблюдаться эффект, аналогичный поднятию контраста и, возможно, большая детализация сцены. Но при RGB-анализе нескольких первых компонент ортогональное преобразование часто позволяет визуально отобразить еще и те объекты, которые не различаются в исходной системе координат пространства признаков, хотя и могут быть разделены автоматическими методами классификации.

При визуализации многозонального изображения используется RGB-композиция. Для ее создания выбираются 3 канала, каждый из которых принимается соответственно за RED, GREEN и BLUE компоненты. Визуальное восприятие цветовой композиции в значительной степени зависит от контраста объектов в каждом из выбранных спектральных диапазонов. Если объекты контрастны хотя бы в одном из диапазонов, то они будут хорошо различаться и на цветном композиционном изображении.

 

Если некоторым классам объектов на изображении соответствуют области значений, расположенные в пространстве признаков так, как это показано на рис.9, то по каждому из направлений исходного базиса интервалы значений яркости для классов A и B будут перекрываться. То есть при визуализации эти классы объектов окажутся неразличимыми. После перехода к новому базису интервалы значений по второй компоненте уже не перекрываются, поэтому объекты в соответствующей RGB-композиции будут контрастны.

В пакете ENVI функция преобразования к главным компонентам находится в блоке Transform главного меню. В пакете ERDAS Imagine эта функция отнесена к блоку Spectral Enhancement модуля Interpreter. В любых ее реализациях предусмотрен выбор желаемого числа компонент (с отбрасыванием наименьших), а также выбор участка изображения для расчета статистических характеристик.     Поскольку характер диаграммы рассеяния для разных наборов из N объектов будет различным, то и результат ортогонального преобразования также будет различным при наборе статистики по разным участкам изображения.

В заключение заметим, что алгоритмами автоматической классификации объекты, показанные на рис.9, будут разделяться и в исходной системе яркостных координат.. Поэтому преобразование к главным компонентам в таких методах может оказаться полезным только при классификации с обучением - для выделения эталонных участков тематических классов.

        

Контрольные вопросы.

1. Объясните вероятностный смысл гистограммы изображения.

2. Какими параметрами характеризуется нормальное распределение?

3. Чем отличается линейное растяжение от эквализации?

4. Объясните понятия «высокочастотная фильтрация» и «низкочастотная фильтрация»».

5. Почему фильтры, осуществляющие свертку изображения с маской, называются линейными?

6. Чем отличается результат медианной фильтрации от результата сглаживания методом скользящего среднего?

7. Что такое диаграмма рассеяния? Как проявляется корреляция изображений в двух каналах на диаграмме рассеяния?

8. Как располагаются векторы нового базиса в пространстве яркостей после преобразования изображения к главным компонентам.

9. Как представляются исходные каналы в системе координат «главных компонент»? Что такое характеристический фактор и факторные нагрузки?

10. Дайте определение коэффициента корреляции и матрицы корреляции.

11. Опишите основные этапы расчета матрицы корреляции между каналами.

12. Как матрица корреляции каналов связана с главными компонентами?

 

 


Дата добавления: 2018-05-12; просмотров: 706; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!