Глава 2. Построение метода сжатия речевых сигналов



 

Описание алгоритмов сжатия речевых сигналов

Алгоритм LPC(линейное предсказание)

Рассмотрим следующую модель речеобразования (рис. 3): система возбуждается импульсной последовательностью для вокализованных звуков речи и шумом для невокализованных [5]. Данная модель имеет следующие параметры: классификатор вокализованных и невокализованных звуков, период основного тона для вокализованных звуков, коэффициент усиления  и коэффициенты цифрового фильтра. Данные параметры медленно меняются с течением времени. Здесь задача определения коэффициентов  цифрового фильтра является наиболее значимой.

Рис.3. Структурная схема упрощённой модели речеобразования

 

Алгоритм линейного предсказания основан на предположении о том, что отсчёты сигнала связаны с сигналами возбуждения  линейным разностным уравнением [5, 6]

 .                   (1)

Тогда передаточная функция линейной системы с входом и выходом  имеет вид:

 ,                 (2)

где  – формальная переменная, и  – z-преобразования речевого сигнала и сигнала возбуждения .

Определим линейный предсказатель с коэффициентами  как систему, на выходе которой в момент времени n имеем

 .             (3)

Системной функцией предсказателя p-го порядка является полином вида

                                  .                            (4)

Погрешность предсказания будет иметь вид

 .             (5)

Иными словами, мы имеем следующую передаточную функцию:

 .                          (6)

Тогда погрешность предсказания будет представлять собой сигнал на выходе системы с данной передаточной функцией.

Для данной модели выполнено равенство . Следовательно, фильтр погрешности предсказания  является обратным фильтром к системе с передаточной функцией . Таким образом, мы приходим к следующему равенству:

 .                                                    (7)

Основной задачей анализа на основе использования инструмента линейного предсказания является определение параметров ,k=1, 2, …, p, где p – порядок анализа [6]. Эти параметры определяются по речевому сигналу.Предполагается, что данные параметры являются параметрами функции в модели речеобразования. В силу изменения свойств речевого сигнала во времени параметры предсказания (их также называют коэффициентами предсказания) должны оцениваться на коротких сегментах речи, называемых кадрами.В качестве критерия оценки берётся минимум суммы квадратов погрешностей линейного предсказания на сегменте речевого сигнала. По данному критерию производится оптимизация синтеза фильтра .

Пусть задан некоторый отрезок [n0; n1]. Тогда сумма квадратов погрешностей линейного предсказания определяется так:

 .                                         (8)

Тогда коэффициенты линейного предсказания можно получить, минимизируя . В итоге получим систему p линейных уравнений относительно p неизвестных a1, a2, …, ap:

 , j=1, 2, …, p,                          (9)

где

 .              (10)

Полученная система носит название системы Юла-Уокера. Решив эту систему, несложно оценить и минимальную достижимую погрешность предсказания.

Проделав некоторые преобразования, получим

 .                                   (11)

Для определения коэффициентов линейного предсказания  из системы уравнений Юла-Уокера нужно найти величины , i=0, 1, …, p, j=1, 2, …, p, где p– порядок линейного предсказания.

Существует множество подходов к вычислению этих величин, включая метод ковариации, метод автокорреляции, метод решётки и т. д. При реализации данного алгоритма было решено воспользоваться методом автокорреляции.

В данном методе пределы анализа полагаются равными . Сигнал вне интервала обнуляется, т. е. при .Взятие таких пределов позволяет упростить выражение для , i=1, 2, …, p, j=0, 1, …, p.

 . (12)

    – функции величины , с точностью до множителя совпадающие с оценками автокорреляционной функции сигнала , вычисленными при

 .           (13)

Поделим уравнения в системе (9) наN. В результате получим систему уравнений Юла-Уокера для автокорреляционного метода:

, j=1, 2, …, p.               (14)

Данная система может быть записана в матричном виде как , где

 .         (15)

Стоит отметить, что матрица Rв таком методе обладает важными свойствами: она симметрическая и теплициева. Такая структура матрицы позволяет решить систему (14) особенно просто: решение находится за операций по алгоритму Левинсона-Дарбина[7].

Анализ на основе линейного предсказания также называют LP-анализом (или LPC-анализом).

Ниже приведена блок-схема устройства LPC-10 вокодера (рис. 4), описывающая общую схему его работы. Порядок LPC-анализа равен 10.

Рис.4. Блок-схема устройства LPC-10 вокодера

 

Скорость вокодера LPC-10 составляет 2400 kbps. ПорядокLPC-анализа pдля данного вокодера равен 10, т. е. на каждом сегменте берётся 10 коэффициентов предсказания. Длина каждого кадра (сегмента) равна 20 мс. Таким образом, скорость составляет 50 кадров в секунду. В сумме на каждый кадр отводится 48 бит.Следует отметить, что помимо распределения битов, указанного непосредственно в стандарте LPC-10E [17], существуют и другие варианты распределения битов. Например, в одном из таких вариантов эти биты распределены следующим образом [8]:

Таблица 1.

Кодирование параметров LPC-10 вокодера в битах.

Название параметра Нотация параметра Число бит на кадр
Коэффициенты линейного предсказания     34
Коэффициент усиления G 7
Период основного тона V/UV, T 7

Итого

48

 

34 бита отведены на хранение коэффициентов линейного предсказания и распределены так:

Таблица 2.

Кодирование параметров линейного предсказания в битах.

LPC Число бит
3
4
4
4
4
3
3
3
3
3
Итого 34

 

    Значение коэффициента усиления Gкодируется 7 битами.

Для вокализованной речи значения T варьируются в диапазоне от 20 до 146. V/UV, T вместе кодируются следующим образом:

Таблица 3.

Кодирование значения высоты тона.

V/UV T Кодированное значение
UV - 0
V 20 1
V 21 2
V 22 3
V 23 4
V 146 127

 

Таким образом, данное значение можно закодировать 7 битами.


Дата добавления: 2018-06-27; просмотров: 911; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!