Сжатие непрерывной информации



Очевидным способом сжатия непрерывной информации является ее преобразование в цифровую форму, так как при этом часть информации удаляется. В этом случае получают последовательность чисел – отсчетов (выборок) исходного сигнала, которую затем можно дополнительно сжать любым из рассмотренных выше методом (в этом случае будет удалена избыточность в получившихся дискретных данных).

В основе преобразования непрерывных сигналов в цифровую форму лежат две операции – дискретизация и квантование. Дискретизация заключается в периодическом измерении непрерывного сигнала (с некоторым интервалом дискретизации) и использование моментальных значений (отсчетов) вместо исходной «волны». Квантование представляет собой приведение значения очередного отсчета к допустимой величине из конечного множества значений, соответствующим уровням квантования, отличающимся на некоторый интервал квантования. Пример преобразования непрерывного сигнала в цифровую форму с 13 отсчетами (с интервалом дискретизации Dt) и 10 уровнями квантования (с интервалом квантования Du) показан на рис. 6.1.

 

 


Для представления результатов дискретизации используют амплитудно-импульсную модуляцию (АИМ): сигнал преобразуется в набор импульсов определенной длительности (меньшей интервала дискретизации) с амплитудами, равными значениям, зафиксированным в момент опроса. Результат квантования можно воспринимать как представление каждого отсчета в виде последовательности импульсов, соответствующей двоичному коду ближайшего к его значению уровня квантования (импульсно-кодовая модуляция, ИКМ). Данные представления результатов дискретизации и квантования играют роль при передаче информации по каналу связи. С точки зрения обработки и хранения информации последовательность отсчетов храниться в памяти вычислительной системы в виде чисел.

Выше были описаны равномерные дискретизация и квантование: интервал дискретизации и интервал квантования являлись постоянными независимо от характера сигнала в тот или иной момент времени. Однако можно значительно сократить избыточность информации за счет применения адаптивных методов преобразования сигнала в цифровую форму.

Рассмотрим метод дифференциальной импульсно-кодовая модуляции (ДИКМ). Он основан на том, что фиксируются не сами моментальные значения, а разница между последовательными значениями. Так как при малом интервале дискретизации последовательно идущие выборки отличаются друг от друга незначительно. В результате ДИКМ понадобиться меньшее количество бит для хранения информации по сравнению с равномерным квантованием. Пусть, например, три последовательные выборки имеют величины 17, 22 и 23. Тогда после ДИКМ получим последовательность чисел 17, 5 и 1, для которых можно получить коды с меньшей средней длиной кодовых слов. При практическом использовании ДИКМ набор допустимых приращений задается заранее.

Идея ДИКМ получила дальнейшее развитие в виде адаптивной ДИКМ (АДИКМ). Методы, использующие АДИКМ, получили широкое распространение как методы компрессии звука, обеспечивающие фактор сжатия 4 при сохранении приемлемого качества звучания. Здесь вместо того, чтобы использовать заранее заданные приращения, набор допустимых приращений определяется, исходя из предварительно считанных данных. Часто данный набор допустимых приращений принимает форму изменяющегося масштабного коэффициента. Подгоняя значение масштабного коэффициента к параметрам конкретного фрагмента, например, звуковой записи, можно добиться более высокого качества, чем при использовании обычной ДИКМ.

Широкое распространение получили также методы компрессии с прогнозированием. В основе таких методов лежит задача поиска способа предсказания последующего элемента данных на основе уже имеющихся данных. При этом если удастся угадать, каким будет следующий элемент, то хранить его не нужно, так как декодер, используя тот же способ прогнозирования, просто вычислит пропущенное значение. Такие методы часто используются для сжатия измерительной информации, поступающей в систему с датчиков (интерполяционные и экстраполяционные методы).

При сжатии звуковой информации широкой применение получили методы компрессии, основанные на нелинейной ИКМ. Это тоже методы адаптивного преобразования в цифровую форму, но их обсудим отдельно.

Основная идея рассматриваемых методов заключается в том, что слух человека устроен так, что практически нечувствителен к небольшим искажениям громких звуков, зато очень хорошо замечает те же искажения в более тихих звуках. Для обеспечения такой чувствительности можно воспользоваться логарифмическими преобразованиями.

Наиболее широко используются методы m- и A-типа. Метод m-типа основан на применении формулы

где s и s m  – исходное и преобразованное значения выборки, при этом s представляет собой дробное число в диапазоне от –1 до +1.

В методе A-типа используется коэффициент A, чаще всего имеющий значение 87.6. Для выборок, значения которых лежат в диапазоне от 0 до 1, метод задается следующей формулой:

где s и sA  – исходное и преобразованное значения выборки.

Отметим, что в методах m- и A-типа больше общих черт, чем различий. При этом главное различие заключается в том, что первые используются в США и Японии, а вторые – в Европе.

Все наиболее совершенные из действующих в настоящее время методов компрессии звука, включая MPEG-аудио, Dolby AC-2 и AC-3, систему Sony MiniDisk (ATRAC), а также RealAudio, основаны на поддиапазонном кодировании. Обычно такое кодирование позволяет сжать звуковые данные в 10 – 20 раз. Поддиапазонные методы заключаются в том, что для повышения эффективности ДКИМ частотный диапазон звука делится на две или более частей (выделяются частотные поддиапазоны) и каждая из частей сжимается по отдельности. Применение нескольких поддиапазонов позволяет использовать знания о строении слуха человека для получения еще более качественной компрессии. Поскольку человек в одних диапазонах частот слышит лучше, чем в других, можно использовать различные параметры компрессии для различных диапазонов. Поддиапазоны, расположенные вблизи центра слышимой человеком области, могут оставаться без изменений, в то время как менее различимые диапазоны – подвергаться менее точной обработке, либо вообще не учитываться. Таким образом, методы поддиапазонного кодирования основаны как на сложном математическом аппарате, используемом для выделения и анализа поддиапазонов, так и на тщательном изучении слуха человека, необходимом для разработки рекомендаций по обработке каждого из поддиапазонов.

Для компрессии речи разработаны специальные методы. Самый простой метод кодирования речи называется кодированием пауз. Он основан на том, что в речи человека присутствует много пауз. Часть их – короткие паузы между словами и фразами, остальное – более длинные паузы между предложениями или репликами разных людей. Часто, выделяя эти паузы и заменяя их компактными кодами, в которых указывается длительность паузы, за счет сжатия удается сэкономить до 50% первоначального объема речевой информации.

Более изощренные алгоритмы состоят из двух частей. Первая – это математическая модель голосового тракта человека. Она представляет собой последовательность уравнений, в которых используется информация о гортани, горле, языке и губах человека для получения звуков, подобных тем, что издает человек. Вторая часть – анализирующий механизм, на основании считанного звука подготавливающий параметры для этой модели. При компрессии разговора используется анализирующее устройство, формирующее последовательность параметров. При декомпрессии записанные параметры передаются в модель голосового тракта и получаются звуки. С помощью подобной технологии удается сжать речь человека в 100 раз и более, сохранив при этом хорошее качество звучания.

 


Дата добавления: 2018-10-26; просмотров: 175; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!