Способы представления информации для ввода в ЭВМ.



Вопрос представления и кодирования информации в компьютере является очень важным вопросом компьютерной грамотности. В статье «Пять поколений ЭВМ» перечисляется элементная база компьютеров разных поколений: электронные лампы, транзисторы, микросхемы. До сих пор ничего принципиально нового не появилось. Перечисленные элементы четко распознают только два состояния: включено или выключено, есть сигнал или нет сигнала.

Для того чтобы закодировать эти два состояния, достаточно двух цифр: 0 (нет сигнала) и 1 (есть сигнал). Таким образом, с помощью комбинации 0 и 1 компьютер (с первого поколения и по сей день) способен воспринимать любую информацию: тексты, формулы, звуки и графику.

Иными словами, компьютеры обычно работают в двоичной системе счисления, состоящей из двух цифр 0 и 1. Все необходимые преобразования (в привычную для нас форму или, наоборот, в двоичную систему счисления) могут выполнить программы, работающие на компьютере.

Обычная для нас десятичная форма счисления состоит из десяти цифр: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9. Кстати, числа 10 в этом списке нет: оно состоит из 0 и 1 – чисел, входящих в десятичную систему счисления.

Один двоичный знак – 0 или 1 – называется бит (англ. bit – сокращение от английских слов binary digit, что означает двоичная цифра). Бит представляет наименьшую единицу информации. Однако компьютер имеет дело не с отдельными битами, а с байтами.

Байт (англ. byte) – число из восьми бит (различные комбинации из восьми нулей и единиц). Байт является единицей измерения информации.

Последовательностью битов можно закодировать текст, изображение, звук или какую-либо другую информацию. Такой метод представления информации называется двоичным кодированием (binary encoding).

Например, чтобы перевести в цифровую форму музыкальный звук, можно применить такое устройство, как аналого-цифровой преобразователь, который из входного звукового (аналогового) сигнала на выходе дает последовательность байтов (цифровой сигнал). Обратный перевод можно сделать с помощью другого устройства – цифро-аналогового преобразователя, и таким образом воспроизвести записанную музыку. На самом деле роль преобразователей (аналого-цифрового и цифро-аналогового) выполняют специальные компьютерные программы, поэтому при использовании компьютера надобности в таких устройствах нет.

Похожим образом обрабатывается и текстовая информация. При вводе в компьютер каждая буква и каждый знак (цифры, знаки препинания, пробел, математические знаки и др.) кодируется, так чтобы один символ занимал 1 байт памяти (восемь бит, сочетание 8-и единиц и нулей). А при выводе на экран монитора или на принтер по этим байтам заново воспроизводятся соответствующие изображения символов текста, понятные человеку.

Сохранить можно не только текстовую и звуковую информацию. В виде кодов хранятся и изображения. Если посмотреть на рисунок с помощью увеличительного стекла, то видно, что он состоит из точек одинаковой величины и разного цвета – это так называемый растр.

Координаты каждой точки можно запомнить в виде числа, цвет точки – это еще одно число для последующего кодирования. Эти числа могут храниться в памяти компьютера и передаваться на любые расстояния. По ним компьютерные программы способны воспроизвести рисунок на экране монитора или напечатать его на принтере. Изображение можно увеличить или уменьшить, сделать темнее или светлее, его можно повернуть, наклонить, растянуть. Мы считаем, что на компьютере обрабатывается изображение, но на самом деле компьютерные программы изменяют числа, которыми отдельные точки изображения представлены (точнее, сохранены) в памяти компьютера.

Таким образом, компьютер может обрабатывать только информацию, представленную в числовой форме. Вся другая информация (звуки, изображения, показания приборов и т. д.) для обработки на компьютере должна быть предварительно преобразована в числовую форму при помощи соответствующих компьютерных программ.

Кодирование информации – это удел не только компьютерной техники. Мы очень часто сталкиваемся с этим явлением, и, порой, этого совсем не замечаем. Не так уж давно мы пользовались телеграфом (эта услуга остается и по сей день). При этом отправляемый текст кодируется в виде последовательностей так называемых «точек» (коротких сигналов) и «тире» (длинных сигналов), отправляется по проводам, а на выходе декодируется и печатается на ленте.

В недавнем прошлом многие люди обязаны были знать эту кодировку, называемую иначе «Азбукой Морзе» по имени ее изобретателя. В музыке информация много веков кодируется с помощью нотной записи, в математике – с помощью математических формул и т.п.

По сравнению с приведенными примерами, кодировка, применяемая для компьютеров, выглядит намного проще, так как в ней используются только «нули» и «единицы». Сравнительная простота кодирования обеспечивает все многообразие представляемой в компьютере информации (от простых текстов до сложнейших графических игр и видеофильмов). Это обусловлено высочайшим быстродействием компьютеров и их способностью к почти мгновенной обработке огромных массивов данных.

Ввод информации в ЭВМ.

Одна и та же информация может быть представлена различными способами. В современной вычислительной технике информация в основном представляются в виде набора сигналов двух видов: намагничено или не намагничено, высокое или низкое напряжение, электрическая цепь включена или отключена. Одино из этих состоянии принято обозначать цифрой 0, а другое 1.

Информация для ввода в ЭВМ кодируется. Представление информации посредством какого-либо алфавита называется кодированием, т.е. кодом называется правило преобразования одного набора знаков в другой.

Например, число 967 может быть записано как: девятьсот шестьдесят семь, 96710, 17088, ЗС716, 11110001112 , то есть в кодировке алфавитов русского языка, десятичного, восьмеричного, шестнадцатеричного, двоичного ис­числения.

От того, как представлена информация, на практике зависит очень многое: спо­собы, хранения, приемы передачи и обработки информации.

Процесс кодирования (его также называют шифрование) информации непосред­ственно связан с процессом декодирования (расшифровки) информации.

Представление информации в виде набора единиц и нулей называется двоичным кодированим. В двоичном кодировании каждый символ (буква, цифра, знаки препинания и др) обозначаются установленным набором последовательности нулей и единиц. В современных персональных компьютерах используя восьмизначный набор нулей и единиц можно закодировать 256 символов (прописные и строчные буквы казахского или русского и латинского алфавита, цифры, арифметические и специальные знаки и знаки препинания).

Двоичное кодирование числовой информации заключается в том, что числа в компьютере представлены в виде последовательностей 0 и 1, или бит. В начале 1980-х гг. процессоры компьютеров были 8-разрядными, за один такт работы процессора компьютер мог обработать 8 бит, т.е. максимальное обрабатываемое целое десятичное число не могло превышать 11111111 в двоичной системе. При дальнейшем повышении разрядности процессоров до 64-разрядных возросла и величина максимального числа, обрабатываемого за один такт.

При двоичном кодирование текстовой информации используют для кодирования каждого символа 1 байт (8 двоичных разрядов), что позволяет закодировать N=28=256 различных символов, которых обычно бывает достаточно для представления текстовой информации: прописные и заглавные буквы русского и латинского алфавита, цифры, знаки, графические символы. Присвоение символу конкретного двоичного кода произведено в соответствии с принятым соглашением, зафиксированным в кодовой таблице.

В различных кодировках одному и тому же двоичному коду соответствуют различные символы. Каждая кодировка задается своей собственной кодовой таблицей.

В задачу пользователя не входит решение проблемы перекодировки текстовых документов. При работе в приложениях Windows предусмотрена возможность автоматической перекодировки документов, созданных в приложениях MS-DOS. При работе в Internet с использованием браузеров Internet Explorer и Netscape Communication происходит автоматическая перекодировка Web-страниц.

При двоичном кодировании текстовой информации каждому символу соответствуют своя уникальная последовательность из восьми нулей и единиц, свой уникальный двоичный код от 00000000 до 11111111 (десятичный код от 0 до 255).

Первые 33 кода (с 0 по 32) соответствуют не символам, а операциям (перевод строки, ввод пробела и т.д.). Коды с 33 по 127 являются интернациональными и соответствуют символам латинского алфавита, цифрам, знакам арифметических операций и знакам препинания. Коды с 128 по 255 являются национальными, т.е. в национальных кодировках одному и тому же коду соответствуют различные символы.

В настоящее время существуют пять различных кодовых таблиц для русских букв, поэтому тексты, созданные в одной кодировке, не будут аналогично отображаться в другой.

Одним из первых стандартов кодирования русских букв на компьютерах был код КОИ-8 (код обмена информацией 8-битный), который применяется на компьютерах с операционной системой UNIX.

Наиболее распространенной является стандартная кириллическая кодировка Microsoft Windows, обозначаемая СР1251 (СР — Code Page — кодовая страница), которую поддерживают все Windows-приложения, работающие с русским языком.

В среде операционной системы MS-DOS используется «альтернативная» кодировка, в терминологии фирмы Microsoft — кодировка СР866.

Для компьютеров Macintosh фирма Apple разработала свою собственную кодировку русских букв (Мас).

Международная организация по стандартизации (International Standards Organization, ISO) утвердила в качестве стандарта для русского языка кодировку, называемую ISO 8859-5.

Новый международный стандарт Unicode отводит на каждый символ не один байт, а два, и потому с его помощью можно закодировать не 256 символов, a N=216 = 65 536 различных символов.

 


Дата добавления: 2020-11-27; просмотров: 254; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!