Кодирование нечисловой информации



 

Цифровое представление символов

Правило цифрового представления символов следующее: каждому символу ставится в соответствие некоторое целое число, то есть каждый символ нумеруется.

Пример:

Рассмотрим последовательность строчных букв русского алфавита: а, б, в, г, д, е, ё, ж, з, и, й. к, л, м. н. о, п, р, с, т, у, ф, х, ц, ч, ш, щ, ъ, ы, в, э, ю, я. Присвоив каждой букве номер от 0 до 33. получим простейший способ представления символов. Последнее число - 32 в двоичной форме имеет вид 100000, то есть для хранения символа в памяти понадобится 6 бит.Так как с помощью шести бит можно представить число 26 - 1 = 63, то шести бит будет достаточно для представления 64 букв.

Имеются разные стандарты для представления, символов, которые отличаются лишь порядком нумерации символов. Наиболее-распространён американский стандартный код для информационного обмена - ASCII [American Standard-Code for Information Interchange] введён в США в 1963г. В 1977 году в несколько модифицированном виде он был принят в качестве всемирного стандарта Международной организации стандартов [International Standards Organization -. ISO] под названием ISO-646. Согласно этому стандарту каждому символу поставлено в соответствие число от 0 до 255. Символы от 0 до 127 - латинские буквы, цифры и знаки препинания - составляют постоянную часть таблицы. Остальные символы используются для представления национальных алфавитов. Конкретный состав этих символов определяется кодовой страницей. В русской версии ОC Windows95 используется кодовая, страница 866. В ОС Linux для представления русских букв более употребительна кодировка КОИ-8. Недостатки такого способа кодировки национального, алфавита очевидны. Во-первых, невозможно одновременное представление русских и ,например, французских букв. Во-вторых, такая кодировка совершенно непригодна для представления, китайских иероглифов. В 1991 году была создана некоммерческая организация Unicode, в которую входят представители ряда фирм (Borland. IBM, Noyell, Sun и др) и которая занимается развитием и внедрением нового стандарта. Кодировка Unicode использует 16 разрядов ,и может содержать 65536 символов. Это символы большинства народов мира, элементы иероглифов, спецсимволы, 5000 – мест для частного использования, резерв из 30000 мест.

Пример:

ASCII-код символа А.= 6510 =4116= 010001112;

Unicode-код символа С= 6710=00000000011001112

Цифровое представление изображений

Под изображением будем понимать прямоугольную область, закрашенную, непрерывно изменяющимся цветом. Поэтому, для представления изображений в целых числах необходимо отдельно дискретизировать прямоугольную область и цвет.

Для описания области она разбивается на множество точечных элементов - пцкселов [pixel]. Само множество называется растром [bit map, dot matrix, raster], а изображения, которые формируются на основе растра, называются растровыми.

Число пикселов называется разрешением [resolution]. Часто встречаются значения 640x480, 800x600. 1024x768. 1280x1024. Каждый пиксел нумеруется, начиная с нуля слева направо и сверху вниз. Для представления цвета используются цветовые модели. Цветовая модель [color model] это правило. по которому может быть вычислен цвет. Самая простая цветовая модель - битовая. В ней для описания цвета каждого цвета каждого пиксела (черного или белого), используется всего один бит. Для представления полноцветных изображений, используются несколько более сложных моделей. Известно, что любой цвет может быть представлен как сумма, трёх основных цветов: красного, зелёного и синего. Если интенсивность каждого цвета представить числом, то любой цвет будет выражаться через набор из трёх чисел. Так определяется наиболее известная цветовая RGB-модель. На каждое число отводится один байт. Так можно представить 224 цвета, то есть примерно 16,7 млн. цветов. Белый цвет в этой модели представляется как (1,1,1), чёрный - (0,0,0); красный - (1,0,0), синий - (0,0,1). Жёлтый цвет является комбинацией красного и зелёного и потому представляется как (1,1,0).

Цветовая модель RGB [Red-Green-Blue] была стандартизирована в 1931 г. и впервые использована в цветном телевидении. Модель RGB является аддитивной моделью, то есть цвет получается в результате сложения базовых цветов. Существуют и другие цветовые модели, которые для ряда задач оказываются более предпочтительными, чем RGB-модель. Например, для представления цвета в принтере используется субтрактивная CMY-модель [Cyan-Magenta-Yellow], цвет в которой получается в результате вычитания базовых цветов из белого цвета. Белому цвету в этой модели соответствует (0.0.0). чёрному - (1,1,1), голубому - (1,0,0). сиреневому - (0,1,0), жёлтому - (0,0,1). В цветовой модели HSV [Hue-Saturation-Value] цвет представляется через цвет, насыщенность и значение, а в модели HLS [Hue-Lightness-Saturation] через оттенок, яркость и насыщенность. Современные графические редакторы, как правило, могут работать с несколькими цветовыми моделями.

 

Цифровое представление звука

Звук можно описать в виде совокупности синусоидальных волн определённых частоты и амплитуды. Частота волны определяет высоту звукового тона, амплитуда - громкость звука. Частота измеряется в герцах (Гц [Hz]). Диапазон слышимости для человека составляет от 20 Гц до 17000 Гц (или 17 кГц).

Задача цифрового представления звука, таким образом, сводится к задаче описания синусоидальной кривой. Каждой дискретной выборке присваивается целое число - значение амплитуды. Количество выборок в секунду называется частотой выборки [sampling rate]. Количество возможных значений амплитуды называется точностью выборки [sampling size]. Таким образом, звуковая волна представляется в виде ступенчатой кривой. Ширина ступеньки тем меньше, чем больше частота выборки, а высота ступеньки тем меньше, чем больше точность выборки.

Пример

Возможности наиболее распространённой современной аппаратуры предусматривают работу с частотой выборки до 44.1 кГц, что позволяет правильно описывать звук частотой до 22,05 кГц. Точность выборки имеет всего два значения 8 бит и 16 бит. То есть для представления амплитуды 8-битного звука используется 28 = 256 уровней амплитуды.

Задания                                                                                                                                  

  1. Закодируйте свое имя, фамилию и отчество с помощью одной из таблиц (win-1251, KOI-8r)
  2. Раскодируйте ФИО соседа
  3. Закодируйте следующие слова, используя таблицы ASCII-кодов: ИНФОРМАТИЗАЦИЯ, МИКРОПРОЦЕССОР, МОДЕЛИРОВАНИЕ
  4. Раскодируйте следующие слова, используя таблицы ASCII-кодов:

88 AD E4 AE E0 AC A0 E2 A8 AA A0

50 72 6F 67 72 61 6D

43 6F 6D 70 75 74 65 72 20 49 42 4D 20 50 43

5. Сколько цветов можно закодировать спомощью 1, 2, 3, 4 битов?

Приложения:

Таблица ASCII-кодов

  Decimal Octal Hex Binary Value

  ------- ----- --- ------ -----

    000 000 000 00000000 NUL (Null char.)

    001 001 001 00000001 SOH (Start of Header)

    002 002 002 00000010 STX (Start of Text)

    003 003 003 00000011 ETX (End of Text)

    004 004 004 00000100 EOT (End of Transmission)

    005 005 005 00000101 ENQ (Enquiry)

    006 006 006 00000110 ACK (Acknowledgment)

    007 007 007 00000111 BEL (Bell)

    008 010 008 00001000  BS (Backspace)

    009 011 009 00001001  HT (Horizontal Tab)

    010 012 00A 00001010  LF (Line Feed)

    011 013 00B 00001011  VT (Vertical Tab)

    012 014 00C 00001100  FF (Form Feed)

    013 015 00D 00001101  CR  (Carriage Return)

    014 016 00E 00001110  SO  

    015 017 00F 00001111  SI

    016 020 010 00010000 DLE (Data Link Escape)

    017 021 011 00010001 DC1 (XON) (Device Control 1)

    018 022 012 00010010 DC2  (Device Control 2)

    019 023 013 00010011 DC3 (XOFF)(Device Control 3)

    020 024 014 00010100 DC4  (Device Control 4)

   021 025 015 00010101 NAK (Negative Acknowledgement)

    022 026 016 00010110 SYN (Synchronous Idle)

    023 027 017 00010111 ETB (End of Trans. Block)

    024 030 018 00011000 CAN (Cancel)

    025 031 019 00011001  EM   

    026 032 01A 00011010 SUB

    027 033 01B 00011011 ESC (Escape)

    028 034 01C 00011100  FS (File Separator)

    029 035 01D 00011101  GS   

    030 036 01E 00011110  RS (Request to Send)

    031 037 01F 00011111  US

    032 040 020 00100000  SP (Space)

    033 041 021 00100001   !

    034 042 022 00100010   "

    035 043 023 00100011   #

    036 044 024 00100100   $

    037 045 025 00100101   %

    038 046 026 00100110   &

    039 047 027 00100111   '

    040 050 028 00101000   (

    041 051 029 00101001   )

    042 052 02A 00101010   *

    043 053 02B 00101011   +

    044 054 02C 00101100   ,

    045 055 02D 00101101   -

    046 056 02E 00101110   .

    047 057 02F 00101111   /

    048 060 030 00110000   0

    049 061 031   00110001   1

    050 062 032 00110010   2

    051 063 033 00110011   3

    052 064 034 00110100   4

    053 065 035 00110101   5

    054 066 036 00110110        6

    055 067 037 00110111   7

    056 070 038 00111000   8

    057 071 039 00111001   9

    058 072 03A 00111010   :

    059 073 03B 00111011   ;

       060 074 03C 00111100   <

    061 075 03D 00111101   =

    062 076 03E 00111110   >

    063 077 03F 00111111   ?

    064 100 040 01000000   @

    065      101 041 01000001   A

    066 102 042 01000010   B

    067 103 043 01000011   C

    068 104 044 01000100   D

    069 105 045 01000101   E

    070 106  046 01000110   F

    071 107 047 01000111   G

    072 110 048 01001000   H

    073 111 049 01001001   I

    074 112 04A 01001010   J

    075 113 04B 01001011   K

    076 114 04C 01001100   L

    077 115 04D 01001101   M

    078 116 04E 01001110   N

    079 117 04F 01001111   O

    080 120 050 01010000   P

    081 121 051 01010001   Q

    082 122 052 01010010   R

    083 123 053 01010011   S

    084 124 054 01010100   T

    085 125 055 01010101   U

    086 126 056 01010110   V

    087 127 057 01011111   W

    088 130 058 01011000   X

    089 131 059 01011001   Y

    090 132 05A 01011010   Z

    091 133 05B 01011011   [

    092 134 05C 01011100   \

    093 135 05D 01011101   ]

    094 136 05E 01011110   ^

    095 137 05F 01011111   _

    096 140 060  01100000   `

    097 141 061 01100001   a

    098 142 062 01100010   b

    099 143 063 01100011   c

    100 144 064 01100100   d

    101 145 065 01100101       e

    102 146 066 01100110   f

    103 147 067 01100111   g

    104 150 068 01101000   h

    105 151 069 01101001   i

    106 152 06A 01101010   j

      107 153 06B 01101011   k

    108 154 06C 01101100   l

    109 155 06D 01101101   m

    110 156 06E 01101110   n

    111 157 06F 01101111   o

    112     160 070 01110000   p

    113 161 071 01110001   q

    114 162 072 01110010   r

    115 163 073 01110011   s

    116 164 074 01110100   t

    117 165 075 01110101   u

    118 166 076 01110110   v

    119 167 077 01110111   w

    120 170 078 01111000   x

    121 171 079 01111001   y

    122 172 07A 01111010   z

    123 173 07B 01111011   {

    124 174 07C 01111100   |

    125 175 07D 01111101   }

    126 176 07E 01111110   ~

    127 177 07F 01111111 DEL

    128        080    10000000 A

    129        081 10000001 Б

    130        082 10000010 В

    131        083 10000011 Г

    132        084 10000100 Д

    133            085    10000101 Е

    134        086 10000110 Ж

    135        087 10000111 З

    136        088 10001000 И

    137        089 10001001 Й

    138        08А   10001010 К

    139        08B 10001011 Л

    140        08C 10001100 М

    141        08D 10001101 Н

    142        08E 10001110 О

    143        08F 10001111 П

    144        090 10010000 Р

    145        091 10010001 С

    146        092 10010010 Т

    147        093 10010011 У

    148        094 10010100 Ф

    149            095 10010101 Х

    150        096 10010110 Ц

    151        097 10010111 Ч

    152        098 10011000 Ш

153   099 10011001 Щ
154   09A 10011010 Ъ

155   09B 10011011 Ы

156   09C 10011100 Ь

157   09D 10011101 Э

158   09E 10011110 Ю

159     09F 10011111    Я

    160        0A0 10100000 а
    161        0A1 10100001 б

    162        0A2 10100010 в

    163        0A3 10100011 г

    164        0A4 10100100 д

    165        0A5 10100101 е

    166        0A6 10100110 ж

    167        0A7 10100111 з
    168        0A8 10101000 и

    169        0A9 10101001 й

    170        0AA 10101010 к

    171        0AB 10101011 л

    172        0AC 10101100 м

    173        0AD 10101101 н

    174        0AE 10101110 о

    175        0AF 10101111    п

    224        0E0 11100000 р

    225        0E1 11100001 с

    226        0E2 11100010 т

    227        0E3 11100011 у

    228        0E4 11100100 ф

    229        0E5 11100101 х

    230        0E6 11100110 ц

    231        0E7 11100111 ч

    232        0E8 11101000 ш

    233        0E9 11101001 щ
    234        0EA 11101010 ъ

    235        0EB 11101011 ы

    236        0EC 11101100 ь

    237        0ED 11101101 э

    238        0EE 11101110 ю

    239        0EF 11101111    я

 

Шестнадцатиричные коды русских букв в различных кодовых таблицах для кириллицы (Cyrillic)

 

Кодовые таблицы Win(cp1251) Unicode KOI8-R DOS,cp866(альтернативная) IS08859-5(основная) Mac
Символ

Кодовые таблицы

  Win(cp1251) Unicode KOI8-R DOS,cp866 (альтернативная) IS08859-5 (основная) Mac
А C0 0410 E1 80 B0 80
Б C1 0411 E2 81 B1 81
В C2 0412 F7 82 B2 82
Г C3 0413 E7 83 B3 83
Д C4 0414 E4 84 B4 84
Е C5 0415 E5 85 B5 85
Ж C6 0416 F6 86 B6 86
З C7 0417 FA 87 B7 87
И C8 0418 E9 88 B8 88
Й C9 0419 EA 89 B9 89
К CA 041A EB 8A BA 8A
Л CB 041B EC 8B BB 8B
М CC 041C ED 8C BC 8C
Н CD 041D EE 8D BD 8D
О CE 041E EF 8E BE 8E
П CF 041F F0 8F BF 8F
Р D0 0420 F2 90 C0 90
С D1 0421 F3 91 C1 91
Т D2 0422 F4 92 C2 92
У D3 0423 F5 93 C3 93
Ф D4 0424 E6 94 C4 94
Х D5 0425 E8 95 C5 95
Ц D6 0426 E3 96 C6 96
Ч D7 0427 FE 97 C7 97
Ш D8 0428 FB 98 C8 98
Щ D9 0429 FD 99 C9 99
Ъ DA 042A FF 9A CA 9A
Ы DB 042B F9 9B CB 9B
Ь DC 042C F8 9C CC 9C
Э DD 042D FC 9D CD 9D
Ю DE 042E E0 9E CE 9E
Я DF 042F F1 9F CF 9F
а E0 0430 C1 A0 D0 E0
б E1 0431 C2 A1 D1 E1
в E2 0432 D7 A2 D2 E2
г E3 0433 C7 A3 D3 E3
д E4 0434 C4 A4 D4 E4
е E5 0435 C5 A5 D5 E5
ж E6 0436 D6 A6 D6 E6
з E7 0437 DA A7 D7 E7
и E8 0438 C9 A8 D8 E8
й E9 0439 CA A9 D9 E9
к EA 043A CB AA DA EA
л EB 043B CC AB DB EB
м EC 043C CD AC DC EC
н ED 043D CE AD DD ED
о EE 043E CF AE DE EE
п EF 043F D0 AF DF EF
р F0 0440 D2 E0 E0 F0
с F1 0441 D3 E1 E1 F1
т F2 0442 D4 E2 E2 F2
у F3 0443 D5 E3 E3 F3
ф F4 0444 C6 E4 E4 F4
х F5 0445 C8 E5 E5 F5
ц F6 0446 C3 E6 E6 F6
ч F7 0447 DE E7 E7 F7
ш F8 0448 DB E8 E8 F8
щ F9 0449 DD E9 E9 F9
ъ FA 044A DF EA EA FA
ы FB 044B D9 EB EB FB
ь FC 044C D8 EC EC FC
э FD 044D DC ED ED FD
ю FE 044E C0 EE EE FE
я FF 044F D1 EF EF DF

Внимание!

Ё A8 0401 B3 F0 A1 DD
ё B8 0451 A3 F1 F1 DE

 

 


Дата добавления: 2019-09-13; просмотров: 216; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!