Статистическое кодирование

⇐ ПредыдущаяСтр 38 из 39Следующая ⇒

Методы статистического кодирования явным образом опираются на теорему Шеннона. Такие методы включают в себя два этапа: оценка вероятности кодируемых элементов (моделирование) и собственно кодирование.

Словарное сжатие

Идея словарного сжатия заключается в замене последовательностей элементов исходных данных на идентификаторы таких фраз некоторого словаря, которые совпадают с замещаемой последовательностью. Методы словарного сжатия построены на использовании факта повторяемости строк символов. Словарь как совокупность фраз может строиться различным образом.

Сжатие табличных данных: метод Хаффмана.

Суть: Вместо того чтобы кодировать все символы одинаковым числом бит, будем кодировать символы, которые встречаются чаще, меньшим числом бит, чем те, которые встречаются реже. Более того, потребуем, чтобы код был оптимален или, другими словами, минимально-избыточен.

Алгоритм: На первом проходе строится частотный словарь и генерируются коды. На втором проходе происходит непосредственно кодирование.

Определение 1: Пусть A={a₁,a₂,_...,a_n} - алфавит из n различных символов, W={w₁,w₂,_...,w_n} - соответствующий ему набор положительных целых весов. Тогда набор бинарных кодов C={c₁,c₂,_...,c_n}, такой что:

(1) c_i не является префиксом для c_j, при i!=j

(2) минимальна (|c_i| длина кода c_i)

называется минимально-избыточным префиксным кодом или иначе кодом Хаффмана.

Дата добавления: 2015-12-16; просмотров: 38; Мы поможем в написании вашей работы!
Поделиться с друзьями:

⇐ Предыдущая 30 31 32 33 34 35 36 373839 Следующая ⇒

Мы поможем в написании ваших работ!