Список цифровых аудиоформатов



Информатика

 

1.

  Структура и принцип действия ЭВМ Принцип действия обычной ЭВМ можно считать копией обычного процесса вычислений (например, с помощью калькулятора) Этапы вычислений: - Определение и задание порядка вычислений - Задание исходных данных - выполнение вычислений (для получения промежуточных результатов) - Получение конечного результата.

Таким образом, ЭВМ содержат следующие основные функциональные блоки (рис. 1)

  1. запоминающее устройство (память);
  2. арифметико-логическое устройство (АЛУ); процессор
  3. управляющее устройство (УУ);
  4. устройстваввода и вывода информации

Путь информации в машине начинается с устройства ввода. ЭВМ может воспринять информацию, считывая ее с карт, с перфоленты, с магнитной ленты, магнитного или лазерного диска, с телетайпа или же получая ее от оператора ЭВМ, сидящего за пультом дисплея. Введенная в ЭВМ информация поступает в оперативный накопитель. Некоторая часть ее остается здесь до поры до времени, не вступая в действие. Другая часть информации попадает в запоминающее устройство. Часть информации, которая нужна для немедленной переработки, тотчас же поступает в АЛУ, состоящее из сумматоров. Они-то и выполняют все арифметические и логические действия. Очень часто АЛУ и устройство управления объединяют в процессор.Процессор - это микросхема, которая производит все операции компьютера, осуществляет управление всеми системами и элементами компьютера.
Характеристики:
1. Операционные ресурсы ЭВМ - это (грубо говоря) перечень возможностей ЭВМ. Сюда включаются:
-Способы представления информации в ЭВМ
-Система команд ЭВМ
-Способы адресации
Операционные ресурсы ЭВМ напрямую связаны с аппаратными средствами, которые характеризуют степень приспособленности ЭВМ для решения тех или иных задач.

  1. Емкость памяти (внешняя и основная) Основная память, какой бы большой она не была, всегда ограничена. Внешняя память не ограничена. Для характеристики компьютера используют емкость основной памяти. Использование памяти идет многобайтно,следовательно, доступ измеряется в байтах (максимальная память 4Гб). Внешняя память - суммарная емкость всех накопительных устройств. Следовательно, необходимо использовать косвенную характеристику - количество накопителей подключаемых к ЭВМ. В современных компьютерах есть также и сверхоперативная память (cashe), ее объем - один из важнейших параметров влияющих на время решения задачи.
  2. БыстродействиеЭВМ характеризует скорость обработки информации компьютером (число операций в секунду (V), время выполнения (t=1/v)). Но для различных операций эти показатели различны, следовательно, реальная характеристика – номинальное быстродействие (Vн) — количество коротких операций в единицу времени (обычно берут операцию "+", а операнды хранятся во внутренних регистрах процессора (R-R)). Иногда также используют в качестве характеристики быстродействия - цикл обращения к основной памяти, а также эффективное быстродействие (Vф) Vф=1/ EpiTi pi - вероятность выполнения i-ой операции. По содержанию производительность ЭВМ - это среднее число операций в единицу времени.

Принципы фон Неймана

В 1946 году трое учёных[1][2] — Артур Бёркс (англ.), Герман Голдстайн и Джон фон Нейман — опубликовали статью «Предварительное рассмотрение логического конструирования электронного вычислительного устройства»[3][4]. В статье обосновывалось использование двоичной системы для представления данных в ЭВМ (преимущественно для технической реализации, простота выполнения арифметических и логических операций — до этого машины хранили данные в десятичном виде[5]), выдвигалась идея использования общей памяти для программы и данных. Имя фон Неймана было достаточно широко известно в науке того времени, что отодвинуло на второй план его соавторов, и данные идеи получили название «принципы фон Неймана».

Принцип однородности памяти

Программы и данные хранятся в одной и той же памяти. Поэтому ЭВМ не различает, что хранится в данной ячейке памяти — число, текст или команда. Над командами можно выполнять такие же действия, как и над данными.

Принцип адресуемости памяти

Основная память структурно состоит из пронумерованных ячеек; процессору в произвольный момент времени доступна любая ячейка. Отсюда следует возможность давать имена областям памяти, так, чтобы к хранящимся в них значениям можно было бы впоследствии обращаться или менять их в процессе выполнения программы с использованием присвоенных имен.

Принцип последовательного программного управления

Предполагает, что программа состоит из набора команд, которые выполняются процессором автоматически друг за другом в определенной последовательности.

Принцип жесткости архитектуры

Неизменяемость в процессе работы топологии, архитектуры, списка команд.

Так же в некоторых источниках[каких?] указывается принцип двоичного кодирования, но существовали машины, работающие с троичным и с десятичным кодом.

2 Командные файлы принадлежат к категории исполняемых файлов. Такие файлы снабжаются типом .ВАТ (от английского слова batch - пачка). Запуск командного файла осуществляется точно так же, как запуск файла типа СОМ или ЕХЕ: указывается имя файла без расширения и, если требуется, параметры.

Роль командных файлов особая. Они могут содержать целую группу команд DOS или обращений к прикладным программам, которые выполняются последовательно или в более сложном порядке. Командный файл, в отличие от исполняемых файлов остальных двух типов, содержит не машинный код программы, а текст, который интерпретируется командным процессором DOS. Таким образом, по форме это обычный текстовый файл. Его строки могут представлять собой: встроенные команды DOS, обращения к исполняемым программам, вызовы других командных файлов, специальные команды для управления выводом на экран, специальные команды для организации ветвлений и циклов, метки.

Все эти конструкции (за исключением меток) могут ие только фигурировать в командных файлах, но и просто вводиться пользователем с клавиатуры. Однако в практической работе лишь команды первых трех типов вводятся пользователем, а остальные конструкции, включая метки, служат главным образом для создания нетривиальных командных файлов.

Те́кстовый файл — компьютерный файл, содержащий текстовые данные, как правило, организованные в виде строк.

Текстовым файлам противопоставляются двоичные файлы, в которых содержатся данные, не рассчитанные на интерпретацию в качестве текста (например, файлы, хранящие закодированные звук или изображение).

В отличие от термина «текстовый формат», характеризующего содержимое данных, термин «текстовый файл» относится к файлу и характеризует его как контейнер, хранящий такие данные.

 

В ЭВМ применяется двоичная система счисления, т.е. все числа в компьютере представляются с помощью нулей и единиц, поэтому компьютер может обрабатывать только информацию, представленную в цифровой форме.

Для преобразования числовой, текстовой, графической, звуковой информации в цифровую необходимо применить кодирование. Кодирование – это преобразование данных одного типа через данные другого типа. В ЭВМ применяется система двоичного кодирования, основанная на представлении данных последовательностью двух знаков: 1 и 0, которые называются двоичными цифрами (binary digit – сокращенно bit).

Таким образом, единицей информации в компьютере является один бит, т.е. двоичный разряд, который может принимать значение 0 или 1. Восемь последовательных бит составляют байт. В одном байте можно закодировать значение одного символа из 256 возможных (256 = 2 в степени 8). Более крупной единицей информации является килобайт (Кбайт), равный 1024 байтам (1024 = 2 в степени 10). Еще более крупные единицы измерения данных: мегабайт, гигабайт, терабайт (1 Мбайт = 1024 Кбайт; 1 Гбайт = 1024 Мбайт; 1 Тбайт = 1024 Гбайт).

Целые числа кодируются двоичным кодом довольно просто (путем деления числа на два). Для кодирования нечисловой информации используется следующий алгоритм: все возможные значения кодируемой информации нумеруются и эти номера кодируются с помощью двоичного кода.

Например, для представления текстовой информации используется таблица нумерации символов или таблица кодировки символов, в которой каждому символу соответствует целое число (порядковый номер). Восемь двоичных разрядов могут закодировать 256 различных символов.

Существующий стандарт ASCII (8 – разрядная система кодирования) содержит две таблицы кодирования – базовую и расширенную. Первая таблица содержит 128 основных символов, в ней размещены коды символов английского алфавита, а во второй таблице кодирования содержатся 128 расширенных символов.

Так как в этот стандарт не входят символы национальных алфавитов других стран, то в каждой стране 128 кодов расширенных символов заменяются символами национального алфавита. В настоящее время существует множество таблиц кодировки символов, в которых 128 кодов расширенных символов заменены символами национального алфавита.

Так, например, кодировка символов русского языка Widows – 1251 используется для компьютеров, которые работают под ОС Windows. Другая кодировка для русского языка – это КОИ – 8, которая также широко используется в компьютерных сетях и российском секторе Интернет.

В настоящее время существует универсальная система UNICODE, основанная на 16 – разрядном кодировании символов. Эта 16 – разрядная система обеспечивает универсальные коды для 65536 различных символов, т.е. в этой таблице могут разместиться символы языков большинства стран мира.

Для кодирования графических данных применяется, например, такой метод кодирования как растр. Координаты точек и их свойства описываются с помощью целых чисел, которые кодируются с помощью двоичного кода. Так черно-белые графические объекты могут быть описаны комбинацией точек с 256 градациями серого цвета, т.е. для кодирования яркости любой точки достаточно 8 - разрядного двоичного числа.

Режим представления цветной графики в системе RGB с использованием 24 разрядов (по 8 разрядов для каждого из трех основных цветов) называется полноцветным. Для поноцветного режима в системе CMYK необходимо иметь 32 разряда (четыре цвета по 8 разрядов).

 

3 Звуковые файлы (sound files, audio files) — файлы, содержащие цифровую запись аудиоданных (голоса, музыкальных произведений или их фрагментов и других звуков любой природы); существуют два основных типа звуковых файлов: с оцифрованным звуком и нотной записью. Звуковые файлы представляют собой составную часть мультимедиа.

Файлы с оцифрованным звуком (digitized sound files) — звуковые файлы, в которых исходная непрерывная («аналоговая») форма сигнала записана в виде последовательности коротких дискретных значений амплитуд звукового сигнала, измеренных («выбранных») через одинаковые промежутки времени и имеющих между собой весьма малый интервал. Процесс замены непрерывного сигнала последовательностью его значений называют дискретизацией (sampling), а такую форму записи — импульсно-кодовой (pulse code). Аппаратная реализация обработки оцифрованного звука состоит в том, что аналого-цифрового преобразователь (АЦП) преобразует аналоговый сигнал в множество цифровых замеров, а при воспроизведении цифро-аналоговый преобразователь (ЦАП) осуществляет обратный процесс — преобразование цифрового сигнала в аналоговый. Файлы с оцифрованным звуком бывают двух видов: с заголовком и без заголовка.

Файлы с нотной записью (song file, music file) — звуковые файлы, которые содержат последовательность команд, сообщающих какую ноту и каким инструментом и как долго нужно воспроизводить в тот или иной момент времени. Формат может предусматривать одновременную игру нескольких музыкальных инструментов, в этом случае говорят о соответствующем количестве голосов.

Список цифровых аудиоформатов

  • AA
  • Dolby Digital (AC3)
  • AAC
  • ADX
  • ASF
  • AHX
  • AIFF
  • APE
  • AUD
  • DMF
  • DTS
  • FLAC
  • MIDI
  • MOD
  • MP1
  • MP2
  • MP3
  • MP4
  • MPC
  • Ogg Vorbis
  • Opus
  • RA
  • TTA
  • VQF
  • VOX
  • VOC
  • WAV
  • WMA
  • XM

Кодирование без потерь

Форматы без сжатия

  • AIFF
  • AU
  • CDDA — формат, используемый в аудио-CD
  • DSD — формат, используемый в SACD
  • IFF-8SVX — Interchange File Format
  • IFF-16SV
  • RAW — сырые замеры без какого-либо заголовка или синхронизации
  • WAV — Microsoft Wave (Waveform audio format). Разработан совместно с IBM

Сжатие звука без потерь

·

    • FLAC (.flac) — свободный кодек из проекта Ogg
    • Lossless Audio (.la)
    • Lossless Predictive Audio Compression (LPAC; .pac)
    • Apple Lossless (.m4a)
    • Monkey's Audio (.ape)
    • OptimFROG (.ofr)[1]
    • RKAU (.rka)[2]
    • Shorten (.shn)
    • TTA — True Audio, свободный кодек
    • TAK (.tak) — (T)om’s lossless (A)udio (K)ompressor
    • WavPack (.wv)
    • Windows Media Audio 9 Lossless (.wma)
    • ADX — формат звука с максимальным битрейтом в 1 Гбит/с

Кодирование с потерями

  • MP2 — MPEG Layer 2
  • MP3 — MPEG Layer 3
  • Vorbis — проект Ogg, свободен и похож по принципам на MP3
  • Speex — проект Ogg, свободен, сжатие голоса, низкий битрейт
  • Opus — проект Ogg, свободен, передача звука по сети; основан на технологиях кодеков CELT и SILK.
  • GSM-FR — GSM Full Rate, изначально для сотовых телефонов
  • G.723.1 — один из базовых речевой кодеков IP-телефонии
  • G.729 — эффективный узкополосный речевой кодек IP-телефонии
  • Windows Media Audio (WMA)
  • AAC (.m4a, .mp4, .m4p, .aac) — Advanced Audio Coding, часто в контейнере MPEG-4
  • Musepack — Musepack (MPC)
  • TwinVQ — Yamaha TwinVQ (VQF)
  • RealAudio (RA, RM)
  • OTS Audio File — похож на MP3
  • SWA — Macromedia Shockwave Audio. Сжатие как в MP3 с дополнительными заголовками для Macromedia Director.[3]

4 Графические файлы (graphics files) — файлы, в которых хранятся любые типы устойчивых графических данных («изображений»), предназначенных для последующей визуализации. Способы организации этих файлов получили наименование графических форматов. После записи в файл изображение перестает быть собственно изображением — оно превращается в цифровые данные. Формат этих данных может измениться в результате операций преобразования файла. В зависимости от характера поддерживаемой графики форматы файлов относят к одному из следующих видов: растровый формат, векторный формат, метафайловый формат. Наиболее распространенные графические форматы:

AI (Adobe Illustrator, Adobe AI) — метафайловый формат, разработанный фирмой Adobe для Macintosh, Microsoft Windows, NeXT; используется для записи и хранения разнородных видов изображения, включая, рисунки, чертежи и декоративные надписи.

PSD (Photoshop Document, Adobe Photoshop, Adobe PSD) — растровый формат, входящий в состав графического редактора Photoshop фирмы Adobe; используется издательскими системами на платформах PC и Macintosh. PSD позволяет записывать c сжатием (RLE) или без него изображение со многими слоями, масками, дополнительными каналами, контурами и другими элементами графики.

ART — формат, разработанный фирмой Gonson-Grace, используется для хранения фотографий и рисунков.

AutoCAD DXF (Drawing Interchange Format) и AutoCAD DXB (Drawing Interchange Binary) — две версии одного формата (без сжатия данных), разработанного и поддерживаемого фирмой Autodesk для САПР-программы AutoCAD, работающей на платформе MS-DOS. DXB является упрощенной (двоичной) версией семибитной DXF. Помимо AutoCAD формат поддерживается многими программами САПР, CorelDRAW и другими, в частности, для обмена данными разных типов: векторно ориентированными данными, текстами, трехмерными чертежами. Однако ряд программ, претендующих на поддержку импорта DXF, реализуют только некоторые его возможности. DXF изменяется с каждой версией AutoCAD. Имена файлов DXF и DXB используют расширения *.dxf, *.dxb, *.sld, *.adi.

BDF (Bitmap Distribution Format) — растровый формат, разработанный фирмой X Consortium для обмена данными растровых шрифтов между X Window и другими системами. Сжатие отсутствует, максимальный размер изображения не ограничен, цвет — монохромный. Каждый файл BDF хранит данные только для одной гарнитуры (группы шрифтов, объединенных единым названием).

BMP — растровый формат, разработанный корпорацией Microsoft для ОС Windows; поддерживается всеми графическими редакторами, работающими под ее управлением, способен хранить как индексированный (до 256 цветов), так и RGB-цвет (16,7 млн. оттенков). Большинство файлов BMP хранятся в несжатом виде.

CDR (CorelDRAW Document) — векторный формат, первоначально известный низкой устойчивостью и плохой совместимостью файлов. Многие программы на РС (FreeHand, Illustrator, PageMaker) могут импортировать файлы CDR. Начиная с седьмой версии, CorelDRAW в файлах CDR применяется компрессия отдельно для векторной и растровой графики; могут внедряться шрифты.

CGM (Computer Graphics Metafile) — стандарт (ANSI и ISO) и метафайловый формат отображения векторных изображений на Web, принятый в конце 1998 года консорциумом 3WC (WWW Consortium). Формат ориентирован на поддержку разнообразных графических изображений, включая художественную графику, технические иллюстрации, картографию, компьютерные издательские системы. Несмотря на то, что CGM содержит множество графических примитивов и атрибутов, он менее сложен, чем PostScript, позволяет создавать более компактные файлы и поддерживает обмен сложными и художественными изображениями высокого качества. В формате используются разные виды сжатия (RLE, CCITT Group 3 и Group 4); цветовая палитра не ограничена. Один файл CGM может содержать несколько изображений.

CPT — растровый формат программы Corel PHOTO-PAINT, обеспечивает хранение полноцветных изображений и векторных объектов.

DPX (Digital Picture Exchange Format; он же — SMPTE Digital Picture Exchange Format) — растровый формат, предназначенный для хранения одного кинокадра или потока видеоданных; разработан фирмой Kodak Cineon, принят ANSI и Обществом инженеров кино и телевидения США (SMPTE) с небольшими изменениями в качестве стандарта. Формат поддерживается программами фирмы Kodak.

DWG — векторный формат программы AutoCAD фирмы Autodesk, предназначенный для хранения чертежей.

EMF (Enchanced Metafile) — метафайловый формат, разработанный корпорацией Microsoft для хранения изображений в виде последовательности команд, приводящих к воспроизведению изображений. В ноябре 2005 года была обнаружена уязвимость EMF и WMF форматов от «атак на переполнение буфера», а в конце декабря — появление семейства Интернет-червей. Заражение происходило при посещении пользователями ряда сайтов, использовавших WMF-уязвимость для загрузки троянских программ на удаленную машину. Вскоре появились и автономные версии вирусов, распространяющихся в виде почтовых червей, в прикрепленных файлах изображений. Корпорация Microsoft отреагировала на эту угрозу выпуском совета по безопасности — Security Advisory 912840, а также (11 января 2005 г.) исправлением систем Windows XP, Windows 2000 (Service Pack 4), Windows Server 2003.

3DS (3D Studio, ASC) — формат, разработанный фирмой Autodesk, средство трехмерного моделирования («описания сцены»); также используется как формат обмена. Формат обеспечивает оптимальное распределение ресурсов на платформе PC, поддерживает все цвета без ограничения, сжатия не имеет. Многие программы трехмерного моделирования читают и записывают файлы в этом формате. Строго говоря, 3DS — это два формата, которые используются как форматы обмена – двоичный с расширением *.3ds и текстовый с расширением *.asc.

EPS (Encapsulated PostScript, EPSF) — упрощенный вариант формата (PDL) PostScript, разрабатывался фирмой Adobe как векторный формат, позднее появилась его растровая разновидность — Photoshop EPS. Формат EPS не может содержать в одном файле более одной страницы и не сохраняет ряд установок для принтера. Как и в файлы печати PostScript, в формате EPS записывают конечный вариант работы, хотя такие программы, как Adobe Illustrator, Photoshop и Macromedia FreeHand могут использовать его как рабочий инструмент.

FH8 (FreeHand Document) — восьмая версия формата FH, предназначен только для ПК Macintosh. С ним могут работать собственно программа FreeHand, Illustrator 7 и ограниченное число программ от Macromedia. Начиная с седьмой версии формат FH имеет полную кроссплатформенную совместимость, однако некоторые эффекты FreeHand несовместимы с PostScript.

FIF (Fractal Image Format) — формат, разработанный фирмой Iterated Systems, используется для хранения фотографий и в Интернете, поддерживает собственную систему сжатия FIF.

FITS (Flexible Image Transport System, FTI) — растровый формат и стандарт хранения изображений, используемый многими организациями (включая научные организации, правительственные органы) для хранения астрономических (полученных орбитальными аппаратами) и наземных изображений (в частности, данных радиоастрономии и оцифрованных фотографических изображений). Формат широко применяется для обмена данными между различными аппаратными платформами и программными приложениями, которые не поддерживают общий файловый формат. FITS считается достаточно простым форматом без сжатия с «неограниченным числом» оттенков серого. В нем можно хранить множество типов данных, включая растровые, ASCII-текст, многомерные матрицы, двоичные таблицы.

GIF (Graphics Interchange Format) — стандартный растровый формат представления изображений в WWW; был разработан в 1987 году фирмой CompuServe, отодвинул на второй план более старые форматы PCX и MacPaint. Основные достоинства: возможность использования на многих платформах и наличие эффективного 12-разрядного LZW алгоритма сжатия с бесплатными (до 1994 г.) реализациями. Формат позволяет хорошо сжимать файлы, в которых много однородных заливок (логотипы, надписи, схемы), записывать изображение «через строчку» (Interlaced mode), благодаря чему, имея только часть файла, можно увидеть изображение целиком, но с меньшим разрешением (GIF поддерживает разрешение до 66536х65536).

IFF (Interchange File Format), ILM, ILBM, LBM (InterLeaved BitMap), Amiga Paint — семейство растровых форматов, разработанных и поддерживаемых для платформ MS-DOS, UNIX, Amiga фирмами Electronics Arts и Commodore-Amiga. Отличительная особенность IFF — его универсальность: он может применяться не только для поддержки графики, но и звука на всех платформах, кроме Amiga. Ранее IFF был известен в качестве 24-битового формата для MS-DOS, но в последствии он начал заменяться форматами TIFF и TGA, а затем форматом JFIF. Некоторые характеристики формата IFF: максимальный размер изображения 64 К на 64 К пикселей; используется в вариантах без сжатия и RLE сжатия, поддерживает цвета от 1- до 24-битовых; формат чисел «старший в младшем», имеет спецификацию на CD; при использовании с MS-DOS и UNIX имена файлов могут иметь расширения *.iff и *.lbm.

JFIF (JPEG File Interchange Format), JFI, JPG, JPEG — растровый формат фирмы C-Cube Microsystems, получил наибольшее распространение, поэтому большинство изображений «JPEG» правильнее было бы называть «JFIF». При помощи JFIF рекомендуется сохранять только конечный вариант работы, поскольку каждое промежуточное сохранение приводит к потерям данных и искажениям исходного изображения.

PCX (PC Paintbrush File Format) — один из наиболее распространенных растровых форматов; предназначен для хранения иллюстраций в настольных издательских системах. Формат был разработан фирмой Zsoft для программы Paintbrush, после заключения OEM-соглашения с корпорацией Microsoft начал применяться в разных системах, работающих с графикой. Основные характеристики: максимальный размер изображения 64 К на 64 К; 24-битовая поддержка цвета; использует RLE-сжатие (может работать и без сжатия); поддерживает работу с CD-ROM. Версиями формата PCX являются DCX и PCC, имена файлов которых имеют соответствующее расширение.

PDF (Portable Document Format) — метафайловый формат, предложенный фирмой Adobe для графических файлов (векторных и растровых), содержащих иллюстрации и текст с большим набором шрифтов и гипертекстовыми ссылками с целью передачи их по сети в сжатом виде.

PDS (Planetary Data System Format) — стандартный формат NASA для хранения данных, собранных с помощью космических аппаратов и наземных наблюдений о Солнце, Луне и планетах; используется также другими организациями для хранения аналогичных данных. Основой формата служит язык описания объектов — ODL (Object Description Language). Максимальный размер изображения и цвета в формате PDS неограничены; поддерживается всеми платформами.

PGML (Precision Graphics Mark-up Language) — векторный формат, который описывает графику в терминах математических формул, а не растровых пикселей, чем достигается экономия дискового пространства и возможность масштабирования изображения без потерь его разрешающей способности и других показателей качества. Формат был представлен на рассмотрение консорциуму W3C (WWW Consortium) в качестве сетевого стандарта фирмами Adobe Systems, IBM, Netscape, Sun Macromedia; используется в Интернете.

Photo-CD (PCD, Kodak Photo CD) — растровый формат, разработанный фирмой Eastman Kodak и предназначенный для хранения и воспроизведения полноцветных изображений (обычно фотоснимков), записанных с различной разрешающей способностью на компакт-диски. Формат поддерживается программами Photo CD ACCess, Photoshop, Shoebjx. Формат Photo CD поддерживает 24-битовые цвета, имеет собственную систему сжатия, максимальный размер изображения 2048х3072 пикселей, позволяет хранить только одно изображение в файле, использует системы сжатия RLE и JPEG (в версии DCT). Более подробные сведения фирма Kodak не разглашает.

PIC (Pictor PC Paint, PC Paint) — растровый формат, разработанный фирмой Paul Mace для программ рисования на платформе MS-DOS, является аппаратно-зависимым форматом, созданным с учетом требований графических адаптеров семейства IBM (CGA, EGA, VGA). Формат PIC схож с форматом PCX, в имени файлов используются расширения *.pic и *.clp.

PICT (Macintosh QuickDraw Picture Format) — стандарт для буфера обмена ПК Macintosh, поддерживает как растровую, так и векторную графику. На ПК Macintosh PICT работает со всеми программами. На РС он читается рядом программ, но работа с ним редко бывает простой. Имена файлов PICT имеют расширение *.pic или *.pct.

PNG (Portable Network Graphics) —растровый формат, одобренный в качестве стандартного консорциумом W3C (WWW Consortium) и призванный заменить GIF. Формат обеспечивает индексацию до 256 цветов, поддержку 24- и 48-разрядного представления цвета (True Color) и реализацию канала прозрачности (так называемого альфа-канала). Алгоритм динамического сжатия изображения без потерь PNG на 10-30% эффективнее подобного вида сжатия, реализованного в формате GIF.

PS (PostScript) — формат языка описания страниц PostScript (он же — язык управления лазерными принтерами) разработан в 1984 году фирмой Adobe. Формат используется для обеспечения печати и хранения шрифтов, а также для обмена отформатированными им документами. Преимущество формата PS заключается в том, что он использует независящую от конкретных устройств систему воспроизведения (в том числе тип принтера или экрана).

RAF (RAW) — растровый формат, используемый в цифровых фотокамерах и поддерживающий изображение непосредственно в том виде, в котором оно было зафиксировано датчиком фотокамеры. Использование этого формата устраняет артефакты, связанные с предварительной обработкой изображения ПО фотокамеры (например, при его JPEG-сжатии) и предоставляет фотографу возможности последующей обработки фотоснимков (производить корректировку выдержки, изменение баланса цветов, увеличивать размер).

RTF (Rich Text Format) — обеспечивает возможность сохранения структуры текстовых документов, позволяет выделять их фрагменты (курсивом или жирным шрифтом, создавать колонки), имена файлов имеют расширение *.rtf.

Scitex CT — растровый формат, разработанный фирмой Scitex; незначительно отличается от TIFF, за исключением одной особенности: на фотонаборных автоматах (Imagesetter) фирмы Scitex Dolev файлы этого формата выводятся несколько быстрее. На РС имена файлов в формате Scitex CT имеют расширение *.sct.

SWF (Shockwave Flash) — внутренний векторный формат программы Flash фирмы Macromedia, используется для анимации в Интернете.

TGA (TrueVision Targa) — формат фирмы Truevision, разработанный для цветного телевидения, поддерживает сжатие RLE, имена файлов имеют расширение *.tga.

TIFF (TIF, Tagged Image File Format) — растровый формат, разработанный корпорацией Aldus, изначально предназначался для больших графических изображений высокого разрешения, полученных путем сканирования. Формат характеризуется высоким качеством передачи и сохранения цвета оригиналов изображений. В дальнейшем формат был адаптирован для профессиональных графических пакетов и расширен.

WMF (Windows Metafile, Microsoft Windows Metafile) — метафайловый формат, созданный для использования с ОС Windows, служит для передачи векторов через буфер обмена (clipboard). WMF поддерживается практически всеми программами, работающими под Windows и так или иначе связанными с векторной графикой. Несмотря на кажущуюся простоту и универсальность, пользоваться форматом WMF рекомендуется только в крайних случаях для передачи так называемых голых векторов. WMF искажает цвет, не сохраняет ряд параметров, которые могут быть присвоены объектам в различных векторных редакторах, не понимается программами, ориентированными на ПК Macintosh. Файлы WMF используют расширение *.wmf.

VML (Vector Mark-up Language) — векторный формат, который был представлен на рассмотрение консорциуму W3C фирмами Microsoft, Hewlett-Packard, Autodesk, Macromedia, Visio; используется в Интернете.

5

Архив — файл, содержащий в себе информацию из одного или нескольких, иногда (сжатых без потерь), других файлов. Является результатом работы программы-архиватора.

Виды архивов

Схема совместного использования архиватора и компрессора

  • Файл, составленный из одного или нескольких файлов и метаданных. Создаются, например, программой tar. Иногда используются совместно с программами сжатия для получения архивов, обычно имеющих расширения типа «.tar.gz» или «.tar.lzma».
  • Файл, содержащий ровно один сжатый файл. Часто встречается в UNIX-подобных ОС: compress, gzip, bzip2, freeze, lzma. Используются самостоятельно или вместе с программами типа tar для получения архивов, обычно имеющих расширения типа «.tar.gz» или «.tar.bz2».

Некоторые архиваторы и форматы архивов объединяют эти две функции в произвольном порядке — например, 7z, ARJ, ZIP. В таких случаях, если сжатие производится после объединения, архив называется «непрерывным». Это позволяет уменьшить размер полученного архива, но затрудняет восстановление при повреждении данных.

Имея архив, можно получить исходный файл с помощью соответствующей программы распаковки (иногда объединённой с программой для создания архивов).

Сам архив может состоять из нескольких файлов для облегчения хранения и переноса большого количества данных при ограничениях на размер одной части — например, носителя данных, или сообщения e-mail. Такой архив называется многотомным.

К архиву может быть присоединён исполняемый код, который при выполнении распаковывает архив. Код может быть полнофункциональной программой распаковки этого формата архивов. Такой архив называется самораспаковывающимся (англ. self-extracting, иногда сокращённо «SFX»).

Данные в архиве могут быть зашифрованы каким-либо способом. При использовании универсальных архиваторов обычно используется просто шифрование с паролем. При последовательном использовании tar, gzip и GnuPG результирующий файл иногда имеет расширение .tar.gz.gpg.

Метаданные

Архив почти всегда содержит метаданные. Например:

  • Имена файлов (кроме некоторых программ сжатия одиночных файлов — например, gzip, где в качестве имени файла используется имя архива без расширения, добавленного такой программой)
  • Идентификаторы владельцев, групп, и т. п. файлов, и их прав
  • Размеры файлов
  • Даты изменения, создания файлов
  • Контрольные суммы файлов для проверки правильности распаковки
  • Размер и контрольные суммы архива
  • Избыточные данные для восстановления данных при повреждении
  • Цифровая подпись создателя архива

Сжатие данных без потерь (англ. Lossless data compression) — метод сжатия данных: видео, аудио, графики, документов представленных в цифровом виде, при использовании которого закодированные данные могут быть восстановлены с точностью до бита. При этом оригинальные данные полностью восстанавливаются из сжатого состояния. Этот тип сжатия принципиально отличается от сжатия данных с потерями. Для каждого из типов цифровой информации, как правило, существуют свои оптимальные алгоритмы сжатия без потерь.

 

Сжатие данных без потерь используется во многих приложениях. Например, оно используется во всех файловых архиваторах. Оно также используется как компонент в сжатии с потерями.

 

Сжатие без потерь используется, когда важна идентичность сжатых данных оригиналу. Обычный пример — исполняемые файлы и исходный код. Некоторые графические файловые форматы, такие как PNG, используют только сжатие без потерь; тогда как другие (TIFF, MNG) или GIF могут использовать сжатие как с потерями, так и без.

Техника сжатия без потерь

В общих чертах смысл сжатия без потерь таков. В исходных данных находят какую-либо закономерность и с учётом этой закономерности генерируют вторую последовательность, которая полностью описывает исходную. Например, для кодирования двоичных последовательностей, в которых много нулей и мало единиц, мы можем использовать такую замену:

00 → 0

01 → 10

10 → 110

11 → 111

В таком случае шестнадцать битов

00 01 00 00 11 10 00 00

будут преобразованы в тринадцать битов

0 10 0 0 111 110 0 0

Такая подстановка является префиксным кодом, то есть обладает такой особенностью: если мы запишем сжатую строку без пробелов, мы всё равно сможем расставить в ней пробелы — а значит, восстановить исходную последовательность. Наиболее известным префиксным кодом является код Хаффмана.

Большинство алгоритмов сжатия без потерь работают в две стадии: на первой генерируется статистическая модель для входящих данных, вторая отображает входящие данные в битовом представлении, используя модель для получения «вероятностных» (то есть часто встречаемых) данных, которые используются чаще, чем «невероятностные».

Статистические модели алгоритмов для текста (или текстовых бинарных данных, таких как исполняемые файлы) включают:

  • Преобразование Барроуза — Уилера (блочно-сортирующая пре-обработка, которая делает сжатие более эффективным)
  • LZ77 и LZ78 (используется DEFLATE)
  • LZW

Алгоритмы кодирования через генерирование битовых последовательностей:

  • Алгоритм Хаффмана (также используется DEFLATE)
  • Арифметическое кодирование

6

Сжатие данных с потерями — метод сжатия (компрессии) данных, при использовании которого распакованные данные отличаются от исходных, но степень отличия не является существенной с точки зрения их дальнейшего использования. Этот тип компрессии часто применяется для сжатия аудио- и видеоданных, статических изображений, в Интернете, особенно в потоковой передаче данных, и цифровой телефонии. Альтернативой является сжатие без потерь.

Типы сжатия с потерями

Существуют две основных схемы сжатия с потерями:

  • В трансформирующих кодеках фреймы изображений или звука обычно трансформируются в новое базисное пространство и производится квантование. Трансформация может осуществляться либо для всего фрейма целиком (как, например, в схемах на основе wavelet-преобразования), либо поблочно (характерный пример — JPEG). Результат затем сжимается энтропийными методами.
  • В предсказывающих кодеках предыдущие и/или последующие отсчеты данных используются для того, чтобы предсказать текущий отсчет изображения или звука. Ошибка между предсказанными данными и реальными вместе с добавочной информацией, необходимой для производства предсказания, затем квантуется и кодируется.

В некоторых системах эти две техники комбинируются путём использования трансформирующих кодеков для сжатия ошибочных сигналов, сгенерированных на стадии предсказания.


Дата добавления: 2018-05-12; просмотров: 508; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!