Методы, основанные на винеровской фильтрации сигнала



В этих методах первоначально по зашумленному речевому сигналу y(t) оценивается передаточная характеристика “оптимального” фильтра. Далее этот фильтр применяется во временной или частотной области. В результате фильтрации находится оценка неискаженного речевого сигнала.

Методы коррекции и сглаживания спектра речевых сигналов

Основная энергия речевого сигнала сосредоточена на определенных частотах, называемых формантами, а энергия шума, вообще говоря, может быть распределена по всему диапазону звуковых частот. Таким образом, используя соответствующий фильтр, реализованный во временной или спектральной области и точно настроенный на формантные частоты, можно уменьшать шум, сохраняя при этом полезный сигнал. Однако поскольку значения формант остаются постоянными только на коротких интервалах времени, то при обработке разных участков речи требуется постоянная адаптивная подстройка фильтра. Это не всегда легко реализуется на практике. Например, такая фильтрация совершенно неприемлема в случае воздействия на сигнал суммы гармонических помех.

Методы сглаживания спектра предназначены для удаления в нем нехарактерных для речи резких перепадов и выравнивания динамического диапазона среднего спектра с целью компенсации амплитудно-частотных искажений сигнала в канале связи или звукозаписи.

Методы адаптивного подавления помех.Группа методов, называемых методами адаптивного подавления (или фильтрации) помех, основана на совместной обработке искаженного сигнала y(t)=s(t)+n(t) и опорного сигнала r(t), некоррелированного с исходным речевым сигналом s(t), но коррелированного c шумом n(t) (либо, наоборот, коррелированного с речью, но некоррелированного c помехой). В процессе адаптивной фильтрации сигнала r(t) формируется оценка коррелированного с r(t) компонента, который вычитается из y(t).

Существуют два типа систем, реализующих принцип адаптивного подавления помех. Различаются они по способу получения опорного сигнала. В первой из них опорный сигнал формируют из зашумленного путем тех или иных преобразований последнего. Иногда такие системы называют одноканальными.

Двухканальные системы основаны на использовании двух, как правило, слабо коррелированных между собой источников получения обрабатываемой смеси речевого сигнала и помех. Например, такой метод может быть реализован в режиме “стереозаписи” при использовании двух разнесенных в пространстве направленных микрофонов, которые по-разному ориентированы на источники полезного сигнала и помехи. Достоинством данного метода является способность в некоторых случаях восстанавливать разборчивость даже самых зашумленных сигналов. Недостаток очевиден — режим “стереозаписи” не всегда может быть реализован на практике.

Методы коррекции на основе моделей речевого сигнала.

Эти методы основаны, как правило, на предположении о линейности передаточной функции голосового тракта в модели образования речевого сигнала. В этом случае сигнал в некоторый момент времени может быть представлен в виде линейной комбинации своих значений в предыдущие моменты. Такие методы называют методами линейного предсказания. При их использовании основной задачей при коррекции является оценка коэффициентов линейного предсказания с последующей реконструкцией исходного речевого сигнала. Однако этим методам присущ серьезный недостаток: в случае обработки сильно зашумленных речевых сигналов не всегда возможно правильно вычислять коэффициенты линейного предсказания. Это, в свою очередь, может еще больше ухудшить разборчивость сигнала на выходе системы линейного предсказания.

Метод “псевдостерео”.

Сущность этого метода - использование двух звуковых сигналов, подаваемых на прослушивание раздельно. В этом качестве обычно используют исходный и обработанный каким-либо другим методом шумоочистки сигнал. Можно использовать и два сигнала, обработанные разными методами. Повышение разборчивости при использовании данного режима воспроизведения является чисто субъективным, “на слух”. Тем не менее, часто оказывается, что в связи с естественной привычкой человека получать звуковую информацию по двум каналам одновременно (то есть слушать обоими ушами) при подобном способе подачи звука суммарный продукт воспроизведения будет казаться более разборчивым, чем каждая из его составляющих в отдельности.


Дата добавления: 2018-05-12; просмотров: 353; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!