Представление информации в компьютере



 

Компьютер может обрабатывать только информацию, представленную в числовой форме. Вся другая информация для обработки на компьютере должна быть преобразована в числовую форму. Например, чтобы преобразовать таким образом музыкальный звук, можно через небольшие промежутки времени измерять его интенсивность на определенных частотах, представляя результаты каждого измерения в числовой форме. С помощью программ для компьютера можно выполнить преобразования полученной информации, например наложить друг на друга звуки различных источников. После этого результат можно преобразовать обратно в звуковую форму.

Аналогичным образом на компьютере можно обработать и текстовую информацию. При вводе в компьютер каждая буква кодируется определенным числом, а при выводе на внешние устройства для восприятия человеком по этим числам строится соответствующее изображение буквы.

Компьютер может обрабатывать числовую, текстовую, графическую, звуковую, видеоинформацию только тогда, когда она представлена в нем в двоичном коде (двоичная форма представления информации), т. е. используется алфавит мощностью в два символа: логический 0 и логическая 1. Связано это с тем, что информацию удобно представлять в виде последовательности сигналов (электрических импульсов): сигнал отсутствует – (0), сигнал есть – (1). Такое кодирование принято называть двоичным, а сами логические последовательности нулей и единиц – машинным языком. Каждая цифра машинного двоичного кода несет количество информации, равное одному биту.

Бит – это единица информации, представляющая собой двоичный разряд, который может принимать значение 0 или 1. При записи двоичной цифры можно реализовать выбор только одного из двух возможных состояний, а значит, она несет количество информации, равное одному биту. Следовательно, две цифры несут информацию 2 бита, четыре разряда – 4 бита и т. д. Чтобы определить количество информации в битах, достаточно определить количество цифр в двоичном машинном коде. Благодаря введению понятия единицы информации появилась возможность определения размера любой информации числом бит. Поэтому объем информации определяют в битах.

Для удобства информацию, представленную в компьютере, описывают многоразрядными последовательностями двоичных чисел. Эти последовательности объединяются в группы по 8 бит. Такая группа именуется байтом; например, число 11010011 – это информация величиной 1 байт. Байт – это восемь последовательных бит. В 1 байте можно кодировать значение одного символа из 256 (28) возможных комбинаций.

Более крупными единицами информации являются: килобайт (Кбайт), мегабайт (Мбайт), гигабайт (Гбайт): 1 Кбайт = 1024 байт; 1 Мбайт = 1024 Кбайт; 1 Гбайт = – 1024 Мбайт. В этих единицах измеряется емкость запоминающих устройств.

Перед тем как кодировать любую информацию, нужно договориться о том, какие используются коды, в каком порядке они записываются, хранятся и передаются. Это называется языком представления информации.

Кодирование текстовой информации. В настоящее время большинство пользователей с помощью компьютера обрабатывают текстовую информацию, которая состоит из символов: букв, цифр, знаков препинания и др. Чтобы закодировать один символ, традиционно используют количество информации, равное 1 байту, т. е. I = 1 байт = 8 бит. В 60‑е годы XX века это было закреплено комитетом ASCII США в ASCII‑стандарте.

Формула, которая связывает между собой количество возможных событий Km количество информации 7, позволяет вычислить, сколько различных символов можно закодировать (считая, что символы – это возможные события):

К = 21 = 28 = 256.

Следовательно, для представления текстовой информации можно использовать алфавит мощностью 256 символов. Суть кодирования заключается в том, что каждому символу ставят в соответствие двоичный код от 00000000 до 11111111 или соответствующий ему десятичный код от 0 до 255.

В середине 90‑х годов XX века появилась новая кодировка – Unicode, поддерживающая 65 536 различных символов. В ней на каждый символ отводится по 2 байта:

К = 21 = 216 = 65 536.

Следует отметить, что кодировка Unicode используется в случаях, когда к кодированию не предъявляются дополнительные требования (например, когда необходимо указать на возникшую ошибку, исправить ошибку, обеспечить секретность информации или использовать ее в различных операционных системах).

Кодирование графической информации. В середине 50‑х годов для больших ЭВМ, которые применялись в научных и военных исследованиях, впервые было реализовано представление данных в графическом виде. В настоящее время широко используются технологии обработки графической информации с помощью персонального компьютера (ПК). Графический интерфейс пользователя стал стандартом де‑факто для программного обеспечения разных классов, начиная с операционных систем. Это связано со свойством человеческой психики: наглядность способствует более быстрому пониманию. Широкое применение получила специальная область информатики – компьютерная графика, которая изучает методы и средства создания и обработки изображений с помощью программно‑аппаратных вычислительных комплексов. Без нее трудно представить уже не только компьютерный, но и вполне материальный мир, так как визуализация данных применяется во многих сферах человеческой деятельности: в медицине, образовании, в опытно‑конструкторских разработках, научных исследованиях и др.

Особенно интенсивно технология обработки графической информации с помощью компьютера стала развиваться в 80‑х годах. Графическую информацию можно представлять в двух формах: аналоговой и дискретной. Живописное полотно, цвет которого изменяется непрерывно, – это пример аналогового представления, а изображение, напечатанное с помощью струйного принтера и состоящее из отдельных точек разного цвета, – это дискретное представление. Для представления графической информации в двоичной форме используются растровый и векторный способы.

Растровый способ.  Вертикальными и горизонтальными линиями изображение разбивается на отдельные точки; каждому элементу ставятся в соответствие коды его цвета и место, которое он занимает. При этом качество кодирования будет зависеть от размера точки и количества используемых цветов. Чем меньше размер точки (т. е. изображение составляется из большего количества точек), тем выше качество кодирования. Чем большее количество цветов используется (т. е. точка изображения может принимать больше возможных состояний), тем больше информации несет каждая точка, а значит, увеличивается качество кодирования. Поэтому информация о каждой клетке будет иметь довольно сложный вид: номер клетки, яркость, тон, насыщенность, цвет и др.

Векторный способ.  Информация вычисляется по специальным формулам, описывающим какой‑либо объект.

Трехмерная графика (3D).  Способ представления графической информации, в котором сочетаются векторный и растровый способы формирования изображений. Теоретически 3D изучает методы и приемы построения объемных моделей объектов в виртуальном пространстве, а на практике создает объемные модели на плоскости.

Кодирование звуковой информации. Мир наполнен самыми разнообразными звуками: тиканьем часов и гулом моторов, завыванием ветра и шелестом листьев, пением птиц и голосами людей. О том, как рождаются звуки и что они собой представляют, люди начали догадываться очень давно. Еще древнегреческий философ и ученый‑энциклопедист Аристотель, исходя из наблюдений, объяснял природу звука, полагая, что звучащее тело создает попеременное сжатие и разрежение воздуха. Так, колеблющаяся струна то разрежает, то уплотняет воздух, а из‑за упругости воздуха эти чередующиеся воздействия передаются дальше в пространство – от слоя к слою, возникают упругие волны. Достигая нашего уха, они воздействуют на барабанные перепонки и вызывают ощущение звука.

На слух человек воспринимает упругие волны, имеющие частоту где‑то в пределах от 16 Гц до 20 кГц (1 Гц – одно колебание в секунду). В соответствии с этим упругие волны в любой среде, частоты которых лежат в указанных пределах, называют звуковыми волнами или просто звуком. В учении о звуке важны такие понятия, как тон и тембр звука. Всякий реальный звук, будь то игра на музыкальных инструментах или голос человека, – это своеобразная смесь многих гармонических колебаний с определенным набором частот.

Колебание, которое имеет наиболее низкую частоту, называют основным тоном,  другие колебания называют обертонами.  

Тембр – это разное количество обертонов, присущих тому или иному звуку, которое придает ему особую окраску. Отличие одного тембра от другого обусловлено не только числом, но и интенсивностью обертонов, сопровождающих звучание основного тона. Именно по тембру мы легко можем отличить звуки рояля и скрипки, гитары и флейты, узнать голос знакомого человека.

Музыкальный звук можно характеризовать тремя качествами:

– тембром, т. е. окраской звука, которая зависит от формы колебаний;

– высотой, определяющейся числом колебаний в секунду (частотой);

– громкостью, зависящей от интенсивности колебаний.

Звуковую информацию можно представить в дискретной и аналоговой формах. Их отличие в том, что при дискретном представлении информации физическая величина изменяется скачкообразно, принимая конечное множество значений. Если же информацию представить в аналоговой форме, то физическая величина может принимать бесконечное количество значений, непрерывно изменяющихся.

Семпл – это промежуток времени между двумя измерениями амплитуды аналогового сигнала. Дословно sample переводится с английского как «образец». В мультимедийной и профессиональной звуковой терминологии это слово имеет несколько значений. Семплом называют также любую последовательность цифровых данных, которые получили путем аналого‑цифрового преобразования. Сам процесс преобразования называют семплированием или дискредитацией.

Важными параметрами семплирования являются частота и разрядность.

Частота  – это количество измерений амплитуды аналогового сигнала в секунду. Если частота семплирования не будет более чем в два раза превышать частоту верхней границы звукового диапазона, то на высоких частотах будут происходить потери. Так как диапазон колебаний звуковых волн находится в пределах от 20 Гц до 20 кГц, то стандартной является частота 44,1 кГц – выбрана с таким расчетом, чтобы количество измерений сигнала в секунду было больше, чем количество колебаний за тот же промежуток времени. Если же частота дискредитации значительно ниже частоты звуковой волны, то амплитуда сигнала успевает несколько раз измениться за время между измерениями, а это приводит к тому, что цифровой отпечаток несет хаотичный набор данных. При цифро‑аналоговом преобразовании такой семпл не передает основной сигнал, а только выдает шум. Для экономии вычислительных ресурсов ЭВМ в мультимедийных приложениях довольно часто применяют меньшие частоты: 11, 22, 32 кГц. Это приводит к уменьшению слышимого диапазона частот, и как следствие происходит искажение звука.

Разрядность  указывает, с какой точностью происходят изменения амплитуды аналогового сигнала. Точность, с которой при оцифровке передается значение амплитуды сигнала в каждый из моментов времени, определяет качество сигнала после цифро‑аналогового преобразования. Именно от разрядности зависит достоверность восстановления формы волны. Для кодирования значения амплитуды обычно используют 8‑, 16– или 20‑битовое представление значений амплитуды. Если использовать 8‑битовое кодирование, то можно достичь точности изменения амплитуды аналогового сигнала до 1/256 от динамического диапазона цифрового устройства (28 = 256). Если использовать 16‑битовое кодирование для представления значений амплитуды звукового сигнала, то точность измерения возрастет в 256 раз. В современных преобразователях принято использовать 20‑битовое кодирование сигнала, что позволяет получать высококачественную оцифровку звука.

Но эти данные истинны только для того сигнала, чей максимальный уровень – 0 дБ. Если нужно семплировать сигнал с уровнем 6 дБ и разрядностью 16 бит, то для кодирования его амплитуды будет оставаться на самом деле только 15 бит. Если нужно семплировать сигнал с уровнем 12 дБ, то для кодирования его амплитуды будет оставаться только 14 бит. С увеличением уровня сигнала увеличивается разрядность его оцифровки, а значит, уменьшается уровень нелинейных искажений, который принято называть шумом квантования.  В свою очередь, каждые 6 дБ, уменьшающие уровень, будут «съедать» по 1 биту.

 


Дата добавления: 2018-10-26; просмотров: 1672; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!