В любом случае по каналу связи вместо самой речи передают так или иначе выделенные и квантованные параметры предсказания, интервал и усиление ОТ, параметры возбуждения. 1 страница



Для стандарта GSM 06.10 выбран речевой кодек с регулярным импульсным возбуждением/долговременным предсказанием и линейным предикативным кодированием с предсказанием (RPE/LTP - LTP-кодек - Regular Pulse Excitation - Long-Term Prediction - Linear Predictive Coder), что позволило снизить скорость передачи до 13 Кбит/сек. В литературе часто используется другое, упрощенное название кодека: RPE-LTP (Regular-Pulse Excitation/Linear Predicative Coding - кодек с регулярным импульсным возбуждением и линейным кодированием с предсказанием).

В нескольких словах, алгоритм, применяемый в GSM, заключается в следующем: несколько фрагментов речи, которые изменяются не очень быстро, используются, чтобы определить актуальный фрагмент; коэффициенты линейной комбинации предыдущих фрагментов вместе с кодированной разницей (отличиями между определенным и актуальным фрагментами) представляют собой сигнал. Речь разбивается на 20 миллисекундные фрагменты, каждый из которых кодируется в 260 битов, давая суммарную скорость передачи 13 кбит/с, т.е. для каждой порции сигнала с помощью специального алгоритма определяются основные параметры сигнала (параметры модели речевого тракта диктора), которые кодируются и в сжатом виде передаются в канал связи корреспонденту. Однако и здесь происходит изъятие из сигнала его частей.

Результирующее кодирование с малой скоростью достигается в три этапа:

- линейным кодированием с предсказанием;

- долговременным предсказанием;

- регулярным импульсным возбуждением.

В декодере на приемном телефоне речевой сигнал восстанавливается (как принято говорить, "синтезируется") по переданным параметрам, по откликам последовательности регулярного импульсного возбуждения (RPE) двухступенчатым синтезирующим фильтром.

Речевой сигнал на приемном конце вычисляется (точнее, синтезируется) по переданным параметрам. При этом структура восстановленного сигнала сильно упрощена по отношению к исходном звуковому сигналу (объем информации о речевом сигнале сокращен примерно в 5 - 10 раз), а общее качество речевого сигнала в канале стандарта GSM и узнаваемость диктора по отношению к стандартному телефонному каналу ухудшаются.

Исторически первым был алгоритм полномасштабного кодирования (Full Rate, FR). Затем появились алгоритмы расширенного полномасштабного кодирования (Enchanced Full Rate, EFR) и кодирования половинного масштаба (Half Rate, HR).

В настоящее время в сетях GSM применяют следующие стандартизованные узкополосные кодеки, стандартизованные ETSI (European Telecommunications Standards Institute) - GSM 06.10, GSM 06.20 (GSM-HR), GSM 06.60 (GSM-EFR), AMR. Другие используемые кодеки, например, MS-GSM, носят частный случай указанных выше. Кодек AMR (Adaptive Multi Rate, ETSI 06.90) - адаптивное кодирование речи с переменной скоростью. Стандарт кодирования звуковых файлов, специально предназначенный для сжатия сигнала в речевом диапазоне частот. Стандартизован ETSI (European Telecommunications Standards Institute). Использование AMR позволяет обеспечить высокую емкость сети с одновременно высоким качеством передачи речи. AMR обладает широким набором скоростей кодирования/декодирования речи и позволяет гибко переключаться на различные режимы в зависимости от окружающих условий или загрузки сети. Всего существует 14 режимов AMR кодека, 8 из них доступно в полноскоростном канале (Full Rate, FR) и 6 в полускоростном канале (Half Rate, HR), т.е.: 4,75 - 2,2 кбит/сек.

Линейное предсказание (LPC - ЛП, см. выше) является одним из наиболее эффективных методов анализа речевого сигнала. Этот метод чаще используют при оценке основных параметров речевого сигнала, таких как период основного тона, форманты, спектр, позволяя достаточно точно и надежно оценить параметры линейной системы с переменными коэффициентами. Кодирование речи на основе метода линейного предсказания заключается в том, что по линии связи передается не речевой сигнал как таковой, а параметры некоторого фильтра, эквивалентного голосовому тракту, и параметры сигнала возбуждения этого фильтра.

В линейном предсказателе с возбуждением от кода CELP (Code Excited Linear Predictive) сигнал возбуждения представляется в виде вектора, которому присваивается определенный индекс, т.е. код.

Выбор оптимального вектора осуществляется с большого множества векторов-кандидатов, которые составляют кодовую книгу. Определение размера кодовой книги возбуждения имеет определяющее значение для создания необходимого качества восстановления синтезированного языка. Скорость речевого сигнала на выходе составляет 12,2 кб/сек.

Суммируя, можно заключить, что осуществляется передача ненативного сигнала, а страницы в виртуальной книге, по которой на оконечном телефоне восстанавливается (синтезируется) сигнал.

Следовательно, никакого сигнала по мобильной связи не передается, а передаются параметры некоей кодовой книги. Современные телефоны могут работать как в сетях GSM-900, так и в GSM-1800 МГц. Если мобильный телефон при работе в сети GSM-900 находит сеть GSM-1800, то он переключается (автоматически или вручную) на работу в данной сети. При этом сеть GSM-1800 имеет большую "проникающую способность", и поэтому, например, в центре Москвы провайдеры осуществляют роуминг по сети GSM-1800. Кроме того, большинство мобильных телефонов поддерживают все описанные выше кодеки.

Речевой сигнал на выходе процедуры кодирования/декодирования по алгоритму GSM всегда имеет участки разрыва непрерывности передачи речевого сигнала в паузах между репликами абонентов и заполнение этих участков прекращения передачи полезного сигнала однородным искусственным сигналом "комфортного шума". Данная специфика речевого сигнала переговоров с использованием сети GSM вводит новые проблемы при обнаружении следов монтажа фонограмм.

"Если кто-либо выполняет монтаж новой фонограммы на основе одной или нескольких фонограмм переговоров абонентов, ведущих разговоры по сотовой телефонной сети GSM, то при размещении монтажных переходов в паузах между репликами разговора обнаружение таких точек монтажного перехода является сложной экспертной задачей, требующей особых методов исследования. Причем выполнить такой монтаж несложно как с помощью компьютерных комплексов цифрового монтажа фонограмм, так и с помощью современных высококачественных аналоговых магнитофонов, применяя режим временной остановки записи" <1>. Еще более эта задача может осложниться, если смонтированная фонограмма была вторично пропущена через телефонную сеть, что может добавить в нее естественный непрерывный шум телефонного канала.

--------------------------------

<1> Иванов И.Л. Экспертное исследование формата GSM // Режим доступа: http://www/illidiy.orel.ru/pub/publ6.htm.

 

На участках речевых пауз по природе цифрового кодирования по алгоритму GSM имеется не реальный звуковой сигнал, а искусственный сигнал "комфортного шума". В случае использования для монтажа фонограмм, в которых переговоры велись абонентами в одной и той же относительно тихой окружающей звуковой обстановке с одних и тех телефонных аппаратов, обнаружить на участках монтажных переходов признаки монтажа обычно не представляется возможным, так как между репликами в GSM-канале имеются участки вставки искусственного шума. Отличить участки, вставленные самим алгоритмом кодирования GSM при передаче, от искусственно вставленных в процессе монтажа фонограммы участков шума вместе с последующими репликами довольно трудно. Во всяком случае в местах таких монтажных переходов отсутствуют щелчки, скачки уровня и частотного диапазона шумов, импульсы включения/выключения аппаратуры записи, обрывки слов или фраз, нарушения логического единства разговора, т.е. все те признаки, поиск которых обычно осуществляют эксперты при исследовании на предмет выявления признаков монтажа фонограмм.

Во избежание ошибок при производстве судебных фоноскопических экспертиз необходимо прежде всего диагностировать речевую фонограмму на предмет использования каких-либо средств сжатия, что позволит правильно оценить в дальнейшем установленные параметры речи.

Считается, что речевой сигнал может быть пригодным для идентификации диктора при обработке его алгоритмами сжатия с определенной нижней границей скорости цифрового потока, а именно:

- 32 кбит/с для ADPCM;

- 9,6 кбит/с для линейных предсказателей.

Речевой материал может быть признан условно пригодным для идентификации диктора, когда эти значения могут составлять:

- 16 кбит/с для ADPCM;

- 8 кбит/с для линейных предсказателей.

Во всех остальных описанных случаях обработанный речевой сигнал должен быть признан непригодным для достоверной экспертной идентификации диктора как физическими методами, так и лингвистическими, поскольку фонетическая структура языка, прошедшего такую обработку, существенно отличается от оригинала.

Использование таких фонограмм в уголовном судопроизводстве в качестве вещественных доказательств видится проблематичным, поскольку смысловое содержание речевого сообщения в таких фонограммах может не соответствовать оригиналу.

Однако в каждом конкретном случае определение пригодности речевого материала для идентификации диктора или установления смыслового содержания требует более детального теоретического и экспериментального его анализа <1>.

--------------------------------

<1> Желудков Р.Н., Тимко Е.В., Усков К.Ю. О влиянии сжатия речи на допустимость речевой фонограммы в уголовное судопроизводство. Материалы 2-й Всероссийской конференции "Теория и практика речевых исследований" (АРСО-2001). М., 2001. С. 110 - 116. Режим доступа: http://expert.com.ua/kniise/articles/zhel1201_2.htm.

 

Для того чтобы оценить, какой компрессии подвергся оцифрованный сигнал, поступивший на экспертное исследование, необходимо знать: тип и марку мобильного телефона, используемого абонентами при разговорах, в какой сети GSM они (разговоры) происходили и какой кодек и с какой скоростью передачи речевого сигнала использовался в конкретном мобильном телефоне.

Без такой информации эксперт не сможет не только провести всестороннее и полное исследование речи, но даже достоверно оценить пригодность фонограмм для идентификационного исследования.

Поскольку эксперту информация об условиях и средствах звукозаписи не предоставлялась, о достоверности сделанных им выводов говорить не приходится.

При отсутствии достоверной информации о технологической цепочке записи представленных фонограмм эксперт должен был отказаться от решения вопросов по идентификации дикторов, так как в его распоряжение поступили спорные фонограммы, объединенные путем перезаписи на одном носителе (микрокассете). При этом нельзя исключить возможность того, что эти фонограммы были переписаны с заранее смонтированных фонограмм или заранее подготовленного макета на монтажном пульте или в цифровом звуковом редакторе. При этом разговоры велись по мобильной связи, при которой записана не нативная речь человека, а синтезированный сигнал, подвергшийся модификации по неизвестному эксперту алгоритму, кодированию и сжатию.

Особенность исследованных экспертом спорных фонограмм заключается в том, что это - фонограммы на микрокассете - со всей очевидностью копии, верность оригиналам которых не была надлежаще удостоверена.

Ошибкой эксперта явилось то, что сравнение при идентификационных исследованиях проводилось по синтезированной речи без сравнения речи каждого неустановленного лица на спорных фонограммах с нативными экспериментальными образцами А., что методически не допускается, так как приводит к ошибочным и недостоверным результатам сравнения. Вывод по такой идентификации нельзя признать обоснованным и достоверным.

Обоснованность заключения эксперта предполагает научную, логическую и методическую грамотность проведенного исследования и изложения его результатов, а также подтверждение выводов эксперта соответствующими фактами и аргументами.

В качестве таких аргументов, имеющих объективный характер, служит развернутая характеристика примененных методов и выявленных признаков, а также детальное описание хода и результатов проведенных исследований, наличие числовых и графических иллюстраций <1>. В анализируемом заключении эксперта таких аргументов, не вызывающих сомнений в их достоверности и объективности, не содержится.

--------------------------------

<1> Россинская Е.Р. Комментарий к Федеральному закону "О государственной судебно-экспертной деятельности". М.: Право и закон, 2002.

 

2. Заключение эксперта от "18" июля 2008 года N 02/08.

Объектами исследования явились: 1) аудиокассета "TDK" с шифром "2-75-21-06-77" с фонограммами телефонных переговоров Струкова В.В. с неустановленным лицом; 2) компакт-диск Oxion CDR-700 mb N 500334 шифр 2-4206-07 с фонограммами образцов речи А., полученными при проведении оперативно-розыскных мероприятий.

Согласно заключению эксперта (стр. 12 - 13) на стороне А аудиокассета "TDK" с шифром "2-75-21-06-77" записано девять фонограмм (спорные фонограммы 1 - 9). Скорость записи 4,76 см/сек.

Исследование на предмет того, является ли представленные на экспертизу 9 фонограмм оригиналами или копиями, эксперт не провел.

Возможность изготовления записи на представленной кассете путем перезаписи заранее подготовленного на монтажном пульте или звуковом редакторе макета из подборки девяти фонограмм, которые могли подвергаться различным изменениям, в том числе и модификации речевого сигнала по заданному определенному алгоритму с целью придания голоса неизвестного лица внешнего подобия голосу А., эксперт не проверял.

При описании спорных фонограмм 1 - 9 на стр. 16 - 24 эксперт говорит о том, что не обнаружено в звучащем сигнале на фонограммах 1 - 9 посторонних сигналов (дополнительных, неоригинальных звуковых событий, так называемых артефактов) и искажений звучания, неадекватных обстоятельствам записи и условиям коммуникативного акта.

Полоса частот полезного сигнала, записанного на спорных фонограммах, - около 4000 Гц, что соответствует записи разговора, ведущегося по сотовой сети мобильной связи.

На приведенной экспертом на рис. 8 динамической спектрограмме явно просматриваются следы оцифровки речевого сигнала, которые не были описаны и учтены экспертом.

Так, хорошо видно, что в области высоких частот присутствуют нелинейные искажения в виде повторения части спектральной структуры речевого сигнала либо зеркального повторения части формантной структуры речевого сигнала.

Указанное обстоятельство позволяет сделать заключение, что на данной кассете записаны фонограммы, которые фиксировались в цифровом виде, а затем были переписаны на компакт-кассету. Уже только на этом основании можно говорить о том, что фонограммы на данной кассете являются копиями, верность которых оригиналам не была надлежаще удостоверена.

На рис. 10 анализируемого заключения экспертам приведена иллюстрация, указывающая на присутствие на спорных фонограммах 50 Гц составляющей, свидетельствующей об использовании сети переменного тока питания звукозаписывающего устройства.

На рис. 11 также явно просматриваются следы оцифровки звукового сигнала, указывающие на то, что спорные фонограммы на данной кассете были записаны при помощи цифрового звукозаписывающего устройства с последующим объединением путем переписи на аналоговую кассету. При этом нельзя исключить, что в цифровые фонограммы могли вноситься изменения и модификации речевых сигналов по определенному алгоритму.

Кроме того, на стр. 27 заключения эксперт указывает, что в исходную, оригинальную информацию при ведении переговоров по сети телефонной связи стандарта GSM в исходный речевой сигнал неминуемо привносятся изменения, связанные с работой речевого кодека. Эти изменения не затрагивают лишь лексико-семантическое и просодическое содержание речевых сообщений, передаваемых в канале связи.

Таким образом, по сведениям, изложенным в заключении эксперта от 18 июля 2008 г. N 02/08, видно, что спорные фонограммы телефонных переговоров В. с неустановленным лицом на аудиокассете TDK с шифром 2-75-21-06-77, со всей очевидностью оригиналами не являются.

Девять цифровых фонограмм были объединены на компакт-кассете путем перезаписи без стоповых пауз между ними. При этом нельзя исключить, что в исходный речевой сигнал, записанный в цифровом виде на компьютере, могли вноситься изменения с модификацией параметров голоса и речи неустановленного лица по определенному алгоритму с уподоблением голоса и речи образцам голоса и речи А.

При этом запись на данной кассете была произведена при помощи устройства, питающегося от сети переменного тока, что противоречит обстоятельствам дела.

Эксперт факт предоставления ей фонограмм-копий со следами цифровой обработки не проверил, следов модификации речевого сигнала при помощи синтезаторов речи и иных устройств цифровой обработки речевых сигналов не выявил. А потому нельзя исключить возможность того, что перед записью на кассету каждая цифровая фонограмма подверглась предварительной обработке с целью модификации параметров голоса и речи неустановленного лица, ведущего переговоры с В., для придания голосу неизвестного внешнего подобия и схожести с образцами голоса А.

Из материалов дела видно, что потерпевшие были ознакомлены с выводами эксперта о принадлежности голоса и речи А. до предъявления им фонограмм телефонных переговоров для опознания. Данный подход следует признать методически порочным, так как он наводит опознающего на определенный вывод, настраивает внимание опознающего при внешнем подобии на поиск только сходных черт, без учета имевшихся различий голоса и речи.

В связи с этим говорить о достоверности проведенного идентификационного исследования не приходится, так как модифицированная по специальному алгоритму речь неизвестного лица могла быть искусственно уподоблена речи А. либо технически искажена так, что достигла уровня сходства их до степени смешения. Указанные экспертом совпадения признаков полностью копируют признаки из заключения эксперта от 8 июля 2008 г. N 01-08 и носят характер выборки отдельных разовых примеров, демонстрируя совпадения на уровне случайного угадывания и внешнего фонетического подобия, вызванного влиянием кодека, работающего в сети мобильной сети сотовой связи GSM, или вследствие искусственного уподобления спектрально-временной структуры сигнала на сравниваемых фонограммах.

В связи с этим то обстоятельство, что фонограммы были переписаны на аналоговый носитель, а не представлены в виде идентичных оригиналам цифровых копиях, настораживает, так как при копировании на аналоговый носитель маскируются и уничтожаются не только следы монтажа, но и те модификации, которые претерпевал исходный речевой сигнал при его синтезе.

При выполнении акустического анализа спорных фонограмм, судя по тексту заключения, эксперт грубо нарушил требования методики и применил для исследования необоснованные и не описанные в методике процедуры. В частности, перед экспертом стояли вопросы о выполнении идентификационного исследования для 9 спорных фонограмм. Поскольку каждая фонограмма получена независимо одна от другой, на каждой фонограмме зафиксирована речь лиц, тождество или отличие которых для разных фонограмм из материалов дела не следует, то перед экспертом и стоит задача определить это тождество и отличие для каждой фонограммы, независимо для каждого отдельного случая. То есть перед экспертом стоит 9 независимых идентификационных задач: имеется ли на спорных фонограммах 1-9 голос и речь А. Необходимо было выполнить как минимум 9 пар независимых идентификационных исследований для 9 фонограмм.


Дата добавления: 2019-02-12; просмотров: 205; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!