Измерение количества информации



В качестве единицы информации Клод Шеннон в 1948 г.предложил принять один бит (англ. bitbinary digit — двоичная цифра; bit (англ.) − немного). Связано это с логической организацией и физическим устройством ПК, как программно управляемого автомата.

Бит в теории информации — количество информации, необходимое для различения двух равновероятных сообщений (типа "орел"-"решка", "чет"-"нечет" и т.п.).

В вычислительной технике битом называют наименьшую "порцию" памяти компьютера, необходимую для хранения одного из двух знаков "0" и "1", используемых для внутримашинного представления данных и команд.

В основе работы такой системы представления информации лежит двоичная система счисления.

Бит — слишком мелкая единица измерения. На практике чаще применяется более крупная единица — байт.

Байт (англ. byte) − единица хранения и обработки цифровой информации. Чаще всего байт считается равным восьми битам, в этом случае он может принимать одно из 256 (28) различных значений. Именно 8 битов требуется для того, чтобы закодировать 1 символ. Это означает, что в помощью 1 байта можно закодировать 256 разных символов.

Название «байт» (слово byte представляет собой сокращение словосочетания BinarY TErm − «двоичный терм») было впервые использовано в 1956 г . В. Бухгольцем (англ. Werner Buchholz) при проектировании первого суперкомпьютера IBM 7030.

Используются также ещё более крупные производные единицы информации:

· 1 Килобайт (Кбайт) = 1024 байт = 210 байт,

· 1 Мегабайт (Мбайт) = 1024 Кбайт = 220 байт,

· 1 Гигабайт (Гбайт) = 1024 Мбайт = 230 байт.

· 1 Терабайт (Тбайт) = 1024 Гбайт = 240 байт,

· 1 Петабайт (Пбайт) = 1024 Тбайт = 250 байт.

· 1 Эксабайт ( Эбайт) = 1024 Пбайта = 260 байт.

· 1 Зеттабайт ( Збайт) = 1024 Эбайта = 270 байт.

· 1 Йоттабайт ( Йбайт) = 1024 Збайта = 280 байт.

Кодирование информации

Кодировка – способ компьютерного представления символов.

Компьютер может обрабатывать только информацию, представленную в числовой форме. Вся другая информация (звуки, изображения, показания приборов и т. д.) для обработки на компьютере должна быть преобразована в числовую форму. Например, чтобы перевести в числовую форму музыкальный звук, можно через небольшие промежутки времени измерять интенсивность звука на определенных частотах, представляя результаты каждого измерения в числовой форме. С помощью компьютерных программ можно преобразовывать полученную информацию, например «наложить» друг на друга звуки от разных источников.

Аналогично на компьютере можно обрабатывать текстовую информацию. При вводе в компьютер каждая буква кодируется определенным числом, а при выводе на внешние устройства (экран или печать) для восприятия человеком по этим числам строятся изображения букв. Соответствие между набором букв и числами называется кодировкой символов.

Как правило, все числа в компьютере представляются с помощью нулей и единиц (а не десяти цифр, как это привычно для людей). Иными словами, компьютеры обычно работают в двоичнойсистеме счисления, поскольку при этом устройства для их обработки получаются значительно более простыми.

В процессе преобразования информации из одной формы представления (знаковой системы) в другую осуществляется кодирование. Процесс кодирования текстовой информации состоит в том, что каждому символу присваивается уникальный десятичный (или шестнадцатеричный) код, который затем представляется в виде двоичного. Данный код называется кодом символа.

Средством кодирования служит таблица соответствия, которая устанавливает взаимно однозначное соответствие между знаками или группами знаков двух различных знаковых систем.

 В процессе обмена информацией часто приходится производить операции кодирования и декодирования информации. При вводе знака алфавита в компьютер путем нажатия соответствующей клавиши на клавиатуре выполняется его кодирование, т. е. преобразование в компьютерный код. При выводе знака на экран монитора или принтер происходит обратный процесс — декодирование, когда из компьютерного кода знак преобразуется в графическое изображение.

Присвоение символу определенного числового кода – это вопрос соглашения.

Для разных типов ЭВМ и операционных систем используются различные таблицы кодировки, отличающиеся порядком размещения символов алфавита в кодовой таблице.

Международным стандартом на персональных компьютерах является таблица кодировки ASCII (American Standard Code for Information Interchange), кодирующая 1 символ 1 байтом. В системе ASCII закреплены две таблицы кодирования: базовая и расширенная. Базовая таблица закрепляет значения кодов от 0 до 127 (коды от 0 до 32 отведены не символам, а функциональным клавишам), а расширенная относится к символам с номерами от 128 до 255.

1 байт в ASCII кодирует 1 символ (8 бит составляют 1 байт, а 28 = 256).

Исторически сложилось так, что первые разработчики компьютеров были носителями английского языка. Что им было необходимо обеспечить для вывода на монитор? Во-первых, 26 букв английского алфавита (строчных), во-вторых, 26 прописных, 9 знаков препинания (. , : ! " ; ? ( ) ), пробел, 10 цифр, 5 знаков арифметических действий (+,-,*, /, ^) и специальные символы (№ % _ # $, и так далее ^, &, >, <, |, \). Получается чуть больше сотни символов. Такой сравнительно небольшой базовый набор символов можно закодировать при помощи таблиц соответствия этого набора машинным кодам (фактически, двоичным числам). Можно вполне ограничиться набором двоичных чисел от 0 до 27 (всего 128 позиций), что и было сделано. Таблица соответствия получила название ASCII (American Standard Code for Information Interchange). В рамках таблицы ASCII создание многоязычных документов являлось очень проблематичной, а в большинстве случаев и совершенно невыполнимой задачей

Национальные стандарты кодировочных таблиц включают международную часть кодовой таблицы без изменений (от 0 до 127), а во второй половине содержат коды национальных алфавитов, символы псевдографики и некоторые математические знаки. К сожалению, в настоящее время существуют пять различных кодировок кириллицы (КОИ8-Р, Windows, MS-DOS, Macintosh и ISO), что вызывает дополнительные трудности при работе с русскоязычными документами.

Хронологически одним из первых стандартов кодирования русских букв на компьютерах был КОИ8 ("Код обмена информацией, 8-битный"). Эта кодировка применялась еще в 70‑е годы на компьютерах серии ЕС ЭВМ, а с середины 80-х стала использоваться в первых русифицированных версиях операционной системы UNIX.

Наиболее распространенной в настоящее время является кодировка Microsoft Windows, обозначаемая сокращением CP1251 ("CP" означает "Code Page", "кодовая страница").

От начала 90-х годов, времени господства операционной системы MS DOS, остается кодировка CP866. Компьютеры фирмы Apple, работающие под управлением операционной системы Mac OS, используют свою собственную кодировку Mac. Кроме того, Международная организация по стандартизации (International Standards Organization, ISO) утвердила в качестве стандарта для русского языка еще одну кодировку под названием ISO 8859-5.

А (СР866 - 80, СР1251 – C0, КОИ8 – Е1), мама (СР1251) = ьрьр (СР866)

В январе 1991 года возник консорциум UNICODE (Unicode Consortium), целью которого является продвижение, развитие и реализация стандарта Unicode как международной системы кодирования для обмена информацией, а также поддержание качества этого стандарта в будущих версиях.

В конце 90-х годов появился новый международный стандарт Unicode, который отводит под один символ не один байт, а два, и поэтому с его помощью можно закодировать не 256, а 1 112 064 различных символов (в первой версии было принято 65536 (216), 1 112 064 – в последующих, последняя версия 2008 г.− 5.1, в ней использеутся пока немногим более 100 000 колодвых позиций). Кодовое пространство разбито на 17 плоскостей по 216(65536) символов. Нулевая плоскость называется базовой, в ней расположены символы наиболее употребительных письменностей.

Полная спецификация стандарта Unicode включает в себя все существующие, вымершие и искусственно созданные алфавиты мира, а также множество математических, музыкальных, химических и прочих символов.


Дата добавления: 2021-07-19; просмотров: 107; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!