Список индивидуальных заданий



Определение энергетического спектра речи (тестовой фонограммы) студента.

Разработать:

а) методику, алгоритм и программу оценки по фонограмме энергетического спектра речи,

б) провести оценку спектра речи по тестовым фонограммам.

Сложность - 1

 

Определение амплитудного спектра типичных сегментов тестовой фонограммы.

Использовать сегменты, соответствующие звукам – шумовым, взрывным, вокализованным.

Разработать:

а) методику, алгоритм и программу оценки по фонограмме амплитудного спектра речи,

б) провести оценку спектра речи по тестовым фонограммам.

Сложность - 1

 

Определение амплитудно-фазового (комплексного) спектра речи (тестовой фонограммы) студента.

Разработать:

а) методику, алгоритм и программу оценки по фонограмме амплитудно-фазового спектра речи для разных временных интервалов,

б) провести оценку спектра речи по тестовым фонограммам:

¨ для отдельных слов,

¨ для отдельных фраз,

¨ для коротких временных сегментов, соответствующих характерным звукам.

Сложность - 1

 

Имитация алгоритма VAD

Разработать:

а) методику, алгоритм и программу определения временных границ для одной тестовой фонограммы (слова «Заказ»), базовое пороговое значение определяется оператором ЭВМ.

· при наличии фонового шума (например, вентилятор ЭВМ),

· при отсутствии фонового шума.

Сложность - 1

 

Разработать алгоритм и программу, реализующую блоковое спектральное оценивание тестовой фонограммы на интервале «квазистационарности» ~20мс.

Результат представляется в виде спектрограммы (сонограммы).

Сложность - 2

 

Корреляционная обработка речевого сигнала (тестовой фонограммы) студента.

Разработать: методику, алгоритм и программу корреляционной обработки фонограммы для разных временных интервалов:

· Tк.об. << Tот ,

· Tк.об. ≈Tот ,

· Tк.об. ≈ 2-4 Tот.

Сложность - 3

 

«Разностная» обработка речевого сигнала (тестовой фонограммы) студента.

Разработать:

а) Нормированный модуль разности:

Fразн=sum(abs(v1-v2))/a, где v1-эталонный вектор, v2- текущий вектор

б) методику, алгоритм и программу корреляционной обработки фонограммы для разных временных интервалов:

· Tр.об. << Tот ,

· Tр.об. ≈Tот ,

· Tр.об. ≈ 2-4 Tот.

Сложность – 3

 

Разработать алгоритм и программу А-компандирования и экспандирования.

а) разработать методику оценки ошибок А-компандирования,

б) провести оценку ошибок А-компандирования (объективную и субъективную).

Сложность – 3

 

Разработать алгоритм и программу Мю-компандирования и экспандирования.

а) разработать методику оценки ошибок Мю-компандирования,

б) провести оценку ошибок Мю-компандирования (объективную и субъективную).

Сложность – 3

 

Разработать алгоритм очистки (фильтрации) фонограммы от НЧ-наводки (частота сетевой наводки ~ 50Гц).

Разработать методику, алгоритм и программу предварительной очистки фонограммы от НЧ-наводки.

Сложность – 3

 

Разработать алгоритм и программу, реализующую преобразование ИКМ в ДИКМ (первого порядка).

а) разработать методику оценки степени сжатия,

б) провести оценку степени сжатия для ДИКМ первого порядка.

Сложность – 3

 

Разработать алгоритм и программу, реализующую преобразование ИКМ в ДИКМ (второго порядка).

а) разработать методику оценки степени сжатия,

б) провести оценку степени сжатия для ДИКМ второго порядка.

Сложность – 3

 

Разработать алгоритм и программу, реализующую преобразование ИКМ в ДИКМ (третьего порядка).

а) разработать методику оценки степени сжатия,

б) провести оценку степени сжатия для ДИКМ третьего порядка.

Сложность – 3

 

Разработать алгоритм и программу, реализующую оценку распределения модуля мгновенных значений фонограммы.

Разработать:

а) методику, алгоритм и программу оценки по фонограмме распределения модуля мгновенных значений фонограммы,

б) алгоритм определения моды распределения.

Сложность – 3

 

Разработать алгоритм и программу, реализующую спектральное разделение тестовой фонограммы на две области НЧ (Fот и гармоники Fот) и ВЧ (формантную).

Сложность – 3

 

Разработать алгоритм и программу, реализующую временное прореживание тестовой фонограммы при Fд = 44100Гц.

Коэффициенты прореживания – Kof_pr = 2, 4, 5,

Разработать вариант алгоритма при Kof_pr =1.5.

Сложность – 3

 

Исследовать влияние жесткого и мягкого ограничения на разборчивость речи.

а) разработать несколько удобных зависимостей с «мягким» ограничением и «клиппирующих» зависимостей,

б) разработать программу по обработке фонограммы,

в) проанализировать разборчивость речи для разных вариантов нелинейного преобразования.

Сложность – 3

 

Оценка влияния частоты временной дискретизации на качество фонограммы. Исследуется ошибка записи фонограммы для различных частот дискретизации

Разработать:

а) методику, алгоритм и программу по формированию из исходной фонограммы с заданной частотой дискретизации,

б) разработать методику оценки ошибок А/Ц-преобразования как функцию частоты дискретизации,

в) провести оценку ошибок записи фонограммы (объективную и субъективную).

Сложность – 3

 

Оценка влияния разрядности амплитудного квантования на качество фонограммы. Исследуется ошибка записи фонограммы для разных вариантов разрядность квантования.

Разработать:

а) методику, алгоритм и программу по формированию из исходной фонограммы фонограмму с заданной разрядностью квантования,

б) разработать методику оценки ошибок А/Ц-преобразования как функцию разрядности квантования,

в) провести оценку ошибок записи фонограммы (объективную и субъективную).

Сложность – 3

 

Разработать алгоритм и программу, реализующую оценку распределения «огибающей» отсчетов фонограммы.

Провести тестирование алгоритма на реальных фонограммах (по базе созданных кратковременных фонограмм). Оценить зависимость выборочных распределений от интервала анализа.

Сложность – 4

 

Разработать алгоритм и программу, реализующую обнаружение речевой активности /алгоритм VAD/.

Провести тестирование алгоритма на реальных фонограммах (по базе созданных кратковременных фонограмм).

Сложность – 5

 

Разработать алгоритм и программу, реализующую разделение сегментов фонограммы на «вокализованные-невокализованные».

Провести тестирование алгоритма на реальных фонограммах (по базе созданных кратковременных фонограмм).

Сложность – 5

 

Разработать алгоритм и программу, реализующую оценивание периода основного тона.

Провести тестирование алгоритма на реальных фонограммах (по базе созданных кратковременных фонограмм).

Сложность – 5

 

Экспериментальное определение частоты ОТ (основного тона). Исследовать распределение частоты ОТ для мужчин и для женщин; однополая выборка должна составлять не менее 5 человек, построить экспериментальную зависимость; сравнить с теоретическими данными (см. Список литературы).

Сложность – 3

 

Определение частоты ОТ (основного тона) методом HPS (Harmonic Product Spectrum).

Сложность – 4

Вопросы для самоподготовки


Дата добавления: 2016-01-05; просмотров: 14; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!