Сжатие информации с потерями.



Все ранее рассмотренные алгоритмы сжатия информации обеспе­чивали возможность полного восстановления исходных данных. Но ино­гда для повышения степени сжатия можно отбрасывать часть исходной информации, т.е. происходить сжатие с потерями. Естественно, что такое сжатие нельзя проводить, например, на финансовой базе данных банка. Но в тех случаях, когда сжимается информация, используемая лишь для качественной оценки (это, как правило, аналоговая информа­ция) сжатие с потерями является очень подходящим.

Сжатие с потерями исполняется в основном для трех видов дан­ных: полноцветная графика (224 ≈ 16 млн. цветов), звук и видеоинфор­мация.

Сжатие с потерями обычно проходит в два этапа. На первом из них исходная информация приводится (с потерями) к виду, в котором ее можно эффективно сжимать алгоритмами 2-го этапа сжатия без по­терь.

Основная идея сжатия графической информации с потерями заклю­чается в следующем. Каждая точка в картинке характеризуется тремя равноважными атрибутами: яркостью, цветом и насыщенностью. Но глаз человека воспринимает эти атрибуты не как равные. Глаз воспри­нимает полностью только информацию о яркости и в гораздо меньшей степени о цвете и насыщенности, что позволяет отбрасывать часть ин­формации о двух последних атрибутах без потери качества изображе­ния. Это свойство зрения используется, в частности, в цветном телеви­зоре, в котором на базовое черно-белое изображение наносят цветовую раскраску.

Для сжатия графической информации с потерями в конце 1980-x установлен один стандарт формат JPEG (Joint Photographic Experts Group - название объединения его разработчиков). В этом формате можно регулировать степень сжатия, задавая степень потери качества.

Сжатие видеоинформации основано на том, что при переходе от одного кадра фильма к другому на экране обычно почти ничего не ме­няется. Таким образом, сжатая видеоинформация представляет собой запись некоторых базовых кадров и последовательности изменений в них, При этом часть информации может отбрасываться. Сжатую подоб­ным образом информацию можно далее сжимать и другими методами. Хотя существует не один стандарт для сжатия видеоданных, наиболее распространенными являются стандарты MPEG (Motion Pictuie Ехperts Group), первый из которых был опубликован в 1988 году. MPEG практически единственный стандарт для записи видео и звуковой информации на CD-ROM, DVD-ROM и в цифровом спутниковом телевидении. Видеоинформацию можно сжать необыкновенно плотно, до 1000 и более раз, что позволяет, например, на одну видеокассету, вписать более ста различных художественных фильмов. Но из-за очень сложных проблем, связанных с правами на интеллектуальную собственность, ре­ально возможности сжатия информации таким образом используются сравнительно редко.

Для сжатии звуковой информации с потерями существует несколь­ко стандартов. Наиболее широко используемый из них это MPEG без видеоданных. Стандарт LPC (Linear Predictive Сoding) использует­ся для сжатия речи. Алгоритм LPC пытается промоделировать рече­вой тракт человека и выдает на выходе буквально текущее состояние участвующих в формировании звуков органов.

 


Лекция 9. Помехозащитное кодирование.

Информационный канал.

Канал информационныйэто совокупность устройств, объеди­ненных линиями связи, предназначенных для передачи информации от источника информации (начального устройства канала) до ее прием­ника (конечного устройства канала).

Линии связиобеспечивают прохождение информационных сигна­лов между устройствами канала. Информация обычно передается при помощи электрического тока (по проводам), света (по оптоволокну), электромагнитных волн радиодиапазона (в пространстве) и, редко, звука (в плотной среде: атмосфере, воде и т.п.) и прочих.

Устройства каналаэто, как правило, репитеры. просто пере­дающие усиленным принятый сигнал (пример, радиорелейные линии). К устройствам канала иногда относят и кодеры/декодеры, но в только тех случаях, когда кодирование/декодирование происходит с высокой скоростью, не требующей ее специального учета, как замедляющего фактора: обычно же кодеры/декодеры относят к источникам или при­емникам информации.

Технические характеристикаканала определяются принципом действия входящих в него устройств, видом сигнала, свойствами и со­ставом физической среды, в которой распространяются сигналы, свой­ствами применяемого кода.

Эффективность каналахарактеризуется скоростью и достоверно­стью передачи информации, надежностью работы устройств и задержкой сигнала во времени.

Задержка сигнала во времениэто интервал времени от отправ­ки сигнала передатчиком до его приема приемником.

Математически канал задается множеством допустимых сообще­ний на входе, множеством допустимых сообщений на выходе и набо­ром условных вероятностей Р(у/х) получения сигнала у на выходе при входном сигнале х. Условные вероятности описывают статистические свойства ''шумов" (или помех), искажающих сигнал в процессе пере­дачи. В случае, когда P ( y /х) = 1 при у = х и Р(у/х) =0, при у≠ х, канал называется каналом без "шумов". В соответствии со структурой входных и выходных сигналов выделяют дискретные и непрерывные каналы. В дискретных каналах сигналы на входе и выходе представля­ют собой последовательность символов одного или двух (по одному для входа и выхода) алфавитов. В непрерывных каналах входной и выход­ной сигналы представляют собой функции от непрерывного параметра-времени. Бывают также смешанные или гибридные каналы, но тогда обычно рассматривают их дискретные и непрерывные компоненты раз­дельно. Далее рассматриваются только дискретные каналы.

Способность канала передавать информацию характеризуется чис­лом пропускной способностью или  емкостью канала (обозначение С).

Для случая канала без шума формула расчета емкости канала име­ет вид С = , где N ( T )- число всех возможных сигналов за время Т.

Пример. Пусть алфавит канала без "шумов" состоит из двух симво­лов 0 и 1, длительность τ секунд каждый. За время Т успеет пройти n = Т/ τсигналов, всего возможны 2n различных сообщении длиной п.

В этом случае С = бод.

На рис. 8  приведена схема, на которой изображен процесс прохо­ждения информации по каналу с описанными в примере характеристи­ками.

 

 

Здесь для кодирования используется уровень сигнала: низкий для 0 и высокий для 1. Недостатки этого способа проявляются в случаях, когда нужно передавать много сплошных нулей или единиц. Малей­шее рассогласование синхронизации между приемником и передатчи­ком приводит тогда к неисправимым ошибкам. Кроме того, многие но­сители информации, в частности, магнитные, не могут поддерживать длительный постоянный уровень сигнала.

Для передачи информации используется обычно другой способ, ко­гда для представления 0 и 1 используются две разные частоты, от­личающиеся друг от друга ровно в два paзa (см. рис.9) это так называемая частотная модуляция (ЧМ или FM).

 

 

Таким образом, при таком кодировании, если сигнал 1 имеет дли­тельность τ, то 0 - 2т.

Рассчитаем емкость этого канала. Нужно рассчитать N(T). Пусть n= Т / τ, тогда получается, что нужно рассчитать сколькими способа­ми можно раpбить отрезок длины nотрезками длины 2 и 1. Получаем, что где первое слагаемое это количество способов, которыми можно разбить отрезок длины n(n-2)отрезками длины 1, второе слагаемое это количество способов, ко­торыми можно разбить отрезок длины n (п —2) отрезами длины 1 и одним отрезком длины 2, третье слагаемое это количество способов, которыми можно разбить отрезок длины п (п — 4) отрезками длины 1 и двумя отрезками длины 2 и т.д. Таким образом. S1 = 1. Вследствие того, что любых к < m , получается, что

 

 

т.е. Sn +1 = Sn + Sn-1 при n > 1. Если положить, что S0 = 1, то S0, S1,… это последовательность 1,1, 2, 3, 5, 8, 13, 21, 34,...., т.е. чис­ла Фибоначчи. С XIX века для вычисления n-го члена последователь­ности Фибоначчи известна формула

Таким образом.

При использовании частотной модуляции на практике нули, как правило, кодируются в два раза плотнее. Это достигается тем, что учитываются не уровни сигнала, асмена уровня (полярности). Если частота v соответствует 1, то с частотой 2 v производится проверка уровня сигнала. Если он меняется, то это сигнал 1, если нет, то 0. На практике частота v это частота синхронизации, т.е. частота импульса, который независимо от данных меняет полярность сигнала, 0 не генерирует импульса смены полярности, а 1 генерирует (см. рис. 10)

 

 

Для записи информации на первые магнитные диски и ленты ис­пользовался метод FM. На гибкие диски 5.25'' и 3.5" информация за­писывается методом MFM (Modified FM) модификацией метода FM, позволяющей в 2 раза повысить плотность записи. Это достигается тем, что частота синхронизации увеличивается вдвое. MFM можно ис­пользовать с теми же физическими каналами, что и FM, потому что импульсы синхронизации не передаются перед 1 и первым 0 в серии нулей (см. рис. 11).

 

 

Метод записи с групповым кодированием, RLL (Run Limited Length), не использует импульсы синхронизации, применяется, в част­ности, в жестких дисках "винчестер" и существует в нескольких разно­видностях. Одна из них основана на замене тетрад байта на 5-битные группы. Эти группы подбираются таким образом, чтобы при передаче данных нули не встречались подряд более двух раз, что делает код са­мосинхронизирующимся. Например, тетрада 1000 заменяется группой бит 11010, а тетрада 0001  11011 (см. рис. 12). Такое кодирование поз­воляет без увеличения частоты сигнала в среднем на несколько процен­тов повысить скорость передачи данных по сравнению с MFM. Суще­ствуют разновидности RLL, в которых заменяются последовательности бит различной длины. Кодирование MFM или FM можно представить как частный случай RLL.

 

 

При необходимости передачи записанных с помощью некоторого кода сообщений по данному каналу приходиться преобразовывать эти сообщения в допустимые сигналы канала, т.е. производить надлежа­щее кодирование, а при приеме данных - декодирование. Кодирование целесообразно производить так, чтобы среднее время, затрачиваемое на передачу, было как можно меньше. Получается, что исходному входно­му алфавиту нужно однозначно сопоставить новый алфавит, обеспечи­вающий большую скорость передачи.

Следующий, основной факт теории передачи информации или ос­новная теорема о кодировании при наличии помех позволяет при зна­нии емкости канала и энтропии передатчика вычислить максимальную скорость передачи данных в канале.

Теорема Шеннона, Пусть источник характеризуется д.с.в. X . Рас­сматривается канал с шумом, т.е. для каждого передаваемого сообще­ния задана вероятность ε его искажения в процессе передачи (вероят­ность ошибки). Тогда существует такая скорость передачи п, завися­щая только от Х, что  сколь угодно близкая к nтакая, что существует способ передавать значения X со скоростью и' и с веро­ятностью ошибки меньшей ε, причем n = С/Н X . Упомянутый способ образует помехоустойчивый код.

Кроме того, Фано доказана следующая обратная теорема о кодировании при наличии помех., Для n' > n можно найти такое поло­жительное число ε, что в случае передачи информации по линии связи со скоростью n' вероятность ошибки ε передачи каждого символа сооб­щения при любом методе кодирования и декодирования будет не меньше ε (ε очевидно растет вслед за ростом n').

 


Дата добавления: 2022-01-22; просмотров: 26; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!