Архивация данных. Архивный файл. Программы-архиваторы, их назначение и возможности
Архивация данных, архивный файл
Архивация (сжатие) необходима не только для экономии места в памяти, но и для надежного хранения копий ценной информации, а также для быстрой передачи информации по сети на другие ЭВМ. Кроме того, возможность отказа магнитных носителей информации, разрушающее действие вирусов заставляет пользователей делать резервное копирование ценной информации на другие (запасные) носители информации.
Процесс записи файла в архивный файл называется архивированием (упаковкой, сжатием), а извлечение файла из архива – разархивированием (распаковкой).
Упакованный (сжатый) файл называется архивом. Архив содержит оглавление, позволяющее узнать, какие файлы содержатся в архиве. В оглавлении архива для каждого содержащегося в нем файла хранится следующая информация:
· имя файла;
· сведения о каталоге, в котором содержится файл;
· дата и время последней модификации файла;
· размер файла на диске и в архиве;
· код циклического контроля для каждого файла, используемый для проверки целостности архива.
Архивация информации – это такое преобразование информации, при котором объем информации уменьшается, а количество информации остается прежним.
Степень сжатия информации зависит от типа файла, а также от выбранного метода упаковки. Степень (качество) сжатия файлов характеризуется коэффициентом сжатия Kc, который определяется как отношение объема сжатого файла Vc к объему исходного файла Vo, выраженное в %:
|
|
Чем меньше Kc, тем выше степень сжатия.
Все используемые методы сжатия информации можно разделить на 2 класса:
‑ Упаковка без потерь информации (обратимый алгоритм) – можно точно восстановить исходную информацию по имеющейся упакованной информации.
‑ Упаковка с потерей информации (необратимый алгоритм) – распакованное сообщение будет отличаться от исходного.
В настоящее время разработано много алгоритмов архивации без потерь. Однако все они используют, в основном, 2 простые идеи.
1. Метод Хаффмана (1952) – основан на учете частот символов. Часто встречающиеся символы кодируются короткими последовательностями битов, а более редкие символы – длинными последовательностями битов. К каждому сжатому архиву прикладывается таблица соответствия имеющихся символов и кодов, заменяющих эти символы.
К маленькому файлу прикладывать таблицу кодировки не выгодно, т.к. она займет места больше, чем сам файл. Чем длиннее файл, тем выгоднее этот метод. Метод Хаффмана эффективен для упаковки текстов.
2. Метод RLE (Run Length Encoding) – основан на выделении повторяющихся фрагментов. В сообщениях часто встречаются несколько подряд идущих одинаковых байтов, а некоторые последовательности байтов повторяются многократно. При упаковке такие места можно заменить командами вида: «повторить данный байт n раз» или «взять часть текста длиной k байт, которые встречалась m байтов назад». При упаковке графической информации чаще встречается первая ситуация, при упаковке текстов – вторая.
|
|
Программы-архиваторы, их назначение и возможности.
Назначение архиваторов - сжатие (архивирование) информации – приведение ее к виду, при котором уменьшается избыточность ее представления.
Существует большое количество программ-архиваторов. В списке наиболее популярных можно отметить ZIP, RAR, 7-Zip (произносится севэн зип), ARJ. Первые две – платные, а две других бесплатные. Впрочем, в операционной системе Windows с файлами формата Zip можно работать без установки программы-архиватора.
Алгоритмы и методы архивации
Разработано и реализовано большое количество различных алгоритмов архивации данных без потери информации, при которых при разархивации данные будут восстановлены в исходном виде.
К примеру, самый простой алгоритм сжатия данных (running) основан на замене повторяющихся битов (в тексте может иметься последовательность одинаковых символов, в графическом файле − закрашенная одним цветом область и так далее). Например, в тексте подряд идут 10 пробелов, которые кодируются 10-ю байтами. При архивации они заменяются 3-мя байтами (первый байт − кодирует заменяемый символ; второй байт − специальный байт «флажка» архивации, который указывает на необходимость развернуть первый байт в последовательность байтов; третий байт указывает количество повторяющихся байтов).
|
|
Сжатие может быть с частичной потерей информации. Такие методы можно применять, например, к аудио, видео данным и к изображениям. Примеры форматов сжатия: MP3, MPG? JPG.
К базовым функциям, которые выполняют большинство современных программ-архиваторов, относятся:
- извлечение файлов из архивов;
- создание новых архивов;
- добавление файлов в имеющийся архив;
- создание самораспаковывающихся архивов;
- создание распределенных архивов на носителях малой емкости;
- тестирование целостности структуры архивов;
- полное или частичное восстановление поврежденных архивов;
- защита архивов от просмотра и несанкционированной модификации.
Подробнее:
http://computer-lectures.ru/arxivaciya-dannyx/9-1-arxivaciya-dannyx/
Дата добавления: 2019-01-14; просмотров: 950; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!