Формы представления информации



Информация - очень емкое понятие, в которое вмещается весь мир: все разнообразие вещей и явлений, вся история, все тома научных исследований, творения поэтов и прозаиков. И все это отражается в двух формах - непрерывной (аналоговой) и дискретной.

Объекты и явления характеризуются значениями физических величин. Например, массой тела, его температурой, расстоянием между двумя точками, длиной пути (пройденного движущимся телом), яркостью света и т.д. Природа некоторых величин такова, что величина может принимать принципиально любые значения в каком-то диапазоне. Эти значения могут быть сколь угодно близки друг к другу, исчезающе малоразличимы, но все-таки, хотя бы в принципе, различаться, а количество значений, которое может принимать такая величина, бесконечно велико.

Такие величины называются непрерывными или аналоговыми величинами, а информация, которую они несут в себе, непрерывной информацией.

Слово "непрерывность" отчетливо выделяет основное свойство таких величин - отсутствие разрывов, промежутков между значениями, которые может принимать величина. Масса тела - непрерывная величина, принимающая любые значения от 0 до бесконечности. То же самое можно сказать о многих других физических величинах - расстоянии между точками, площади фигур, напряжении электрического тока.

Кроме непрерывных существуют иные величины, например, количество людей в комнате, количество электронов в атоме и т.д. Такого рода величины могут принимать только целые значения, например, 0, 1, 2, ..., и не могут иметь дробных значений. Величины, принимающие не всевозможные, а лишь вполне определенные значения, называют дискретными. Для дискретной величины характерно, что все ее значения можно пронумеровать целыми числами.

Примеры дискретных величин: геометрические фигуры (треугольник, квадрат, окружность), буквы алфавита, цвета радуги.

Можно утверждать, что различие между двумя формами информации обусловлено принципиальным различием природы величин. В то же время непрерывная и дискретная информация часто используются совместно для представления сведений об объектах и явлениях.

Представление информации. Естественные и формальные языки. Двоичное кодирование информации.

Независимо от формы представления и способа передачи информации, она всегда передается с помощью какого-либо языка.

В качестве основного средства для обмена информацией с другими людьми человек использует естественные языки, например, русский, английский, японский и др. Естественные языки существуют в устной (фонетика) и письменной (грамматика) форме (сейчас практически невозможно встретить язык, который не имеет письменной формы). В основе языка лежит алфавит, т.е. набор символов, которые используются для построения более крупных конструкций языка. Вообще естественными языками как предметом изучения занимается такая наука, как филология. В информатике гораздо большее внимание уделяется формальным языкам.

Основой формальных языков также служит алфавит. Но, в отличие от естественных, в формальных языках он довольно жестко фиксирован. Кроме того, правила грамматики и синтаксиса здесь более строгие, формализованные, фиксированные, существует ряд ограничений. В искусственных знаковых системах отсутствует многозначность. Каждая лексическая единица − слово − имеет ровно один смысл, и наоборот. Отсутствует или сильно снижена способность к перефразированию, то есть изменению формы высказывания при полном сохранении смысла.

Языки программирования (и другие средства записи алгоритмов) тоже относятся к формальным. При автоматизированной обработке информации нет возможности использования естественных языков.

Правила построения конструкций формальных языков определяются их синтаксисом, а правила их толкования − семантикой. Синтактика знаковых систем занимается изучением их структуры, правил соединения отдельных знаков. Семантика изучает отношение между знаком и тем, что он замещает, представляет.

Кодирование информации подразумевает преобразование знаков одной знаковой системы в знаки или группы знаков другой знаковой системы. Обратное преобразование называют декодированием.

Кодирующим отображением называется такое отображение F множества слов в некотором алфавите на множество слов в том же или каком-то другом фиксированном алфавите. Обычно исходное множество для кодирующего отображения F называется входным, алфавитом, а результат отображения − выходным алфавитом.

Применение кодирующего отображения F к любому слову из входного алфавита называется кодированием, а само кодирующее отображение F − кодом. То есть код − это правило, по которому осуществляется кодирование.

Если обозначить входной и выходной алфавиты символами А и В соответственно, то наиболее простым правилом кодирования является сопоставление каждому символу входного алфавита А слова конечной длины в выходном алфавите В. Код может быть задан в форме таблицы, графа, аналитического выражения, то есть в тех же формах, что и отображение.

При кодировании информации для представления ее в памяти ЭВМ используется двоичный способ, т.е. любая информация, будь то числа, текст, графическое изображение, звук или видео, представляется универсальным двоичным кодом. Алфавит этого кода составляют символы 0 и 1. Почему был выбран именно этот способ кодирования? Дело в том, что в некоторых из первых ЭВМ предпринимались попытки внедрить десятичный или троичный код, но ни один из этих вариантов кодирования не дожил до современности. Ответ на вопрос довольно прост: два существенно различных состояния, представляющих, соответственно, 0 или 1, технически реализовать значительно проще, чем во всех остальных случаях. Действительно, отсутствие напряжения может изображать 0, наличие − 1; отсутствие намагниченности участка носителя информации − 0, намагниченность − 1 и т.д. Поэтому другие варианты были просто изжиты. Каждая цифра машинного кода несет 1 бит информации.

Данные – составная часть информации. Они представляют собой зарегистрированные сигналы. При этом физический метод регистрации может быть любым. В соответствии с методом регистрации данные могут храниться и транспортироваться на носителях различных видов. Самым распространенным носителем данных, хотя и не самым экономичным, по-видимому, является бумага.

В качестве носителей, использующих изменение магнитных свойств, можно назвать магнитные ленты и диски; в качестве носителей, использующих изменение оптических свойств, можно назвать CD, DVD и BlueRay носители.

Для автоматизации работы с данными, относящимися к различным типам, очень важно унифицировать их форму представления – для этого обычно используется прием кодирования, то есть выражение данных одного типа через данные другого типа. Естественные человеческие языки – это не что иное, как системы кодирования понятий для выражения мыслей посредством речи.

Проблема универсального средства кодирования достаточно успешно реализуется в отдельных отраслях техники, науки и культуры. В качестве примеров можно привести систему записи математических выражений, телеграфную азбуку, морскую флажковую азбуку, систему Брайля для слепых и многое другое.

Своя система существует и в вычислительной технике – она называется двоичным кодированием и основана на представлении данных последовательностью всего двух знаков: 0 и 1. Эти знаки называются двоичными цифрами, по-английски – binary digit, или, сокращенно, bit (бит).

Одним битом могут быть выражены два понятия: 0 или 1 (да или нет, черное или белое, истина или ложь и т. п.). Если количество битов увеличить до двух, то уже можно выразить четыре различных значения: 00 01 10 11.

Тремя битами можно закодировать восемь различных значений:

000 001 010 011 100 101 110 111.

Увеличивая на единицу количество разрядов в системе двоичного кодирования, мы увеличиваем в два раза количество значений, которое может быть выражено в данной системе. Таким образом, используя i  бит, можно закодировать N различных состояний, при этом i= log2N (т.е. N=2i).

 

 


Дата добавления: 2018-09-22; просмотров: 413; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!