Переполнение в целочисленной арифметике



В системе дополнения до двух n бит могут представлять значения из диапазона от  −2n-1 до +2n-1-1. Используя, предположим, четыре бита, можно представить чис­ла от -8 до +7 (рис. 4.1). Когда результат арифметической операции выходит за пределы представимого диапазона, происходит арифметическое переполнение. При сложении беззнаковых чисел индикатором переполнения служит перенос сn из позиции старшего разряда. Однако при сложении чисел со знаком это не сра­батывает. Возьмем, к примеру, 4-битовые числа со знаком. Если попытаться сло­жить числа +7 и +4, результирующим вектором суммы S будет 1011, а это код числа -5. Как видите, результат сложения неверный, хотя сигнал переноса из по­зиции MSB равен 0. Точно так же при сложении чисел -4 и -6 получим вектор S = 0110 = +6, то есть еще один ошибочный результат. Сигнал переноса в данном случае равен 1. Таким образом, переполнение может произойти при условии, что оба слагаемых имеют одинаковый знак. Сложение же чисел с разными знаками не вызывает переполнения.

Отсюда можно сделать следующие выводы.

1. Переполнение может произойти только при сложении чисел с одинако­выми знаками.

2. При сложении чисел со знаком сигнал переноса из позиции знакового би­та не является индикатором переполнения.

Способ обнаружения переполнения заключается в анализе знаков слагаемых Х и У и знака результата. Если оба операнда, Х и Y, имеют один и тот же знак, ин­дикатором переполнения является несовпадение их знака со знаком суммы.

Символы

Компьютеры должны обрабатывать не только числа, но и текстовую информа­цию, состоящую из символов. Под термином «символы» подразумеваются буквы алфавита, десятичные цифры, знаки препинания и т. п. Они представляются ко­дами, обычно имеющими длину 8 бит. Одной из наиболее широко распространен­ных кодовых таблиц является таблица ASCII (American Standard Code For Infor­mation Interchange), приведенная в приложении.

4.3. Обработка чисел с плавающей запятой

До сих пор речь шла только о числах с фиксированной запятой и целочисленных значениях, то есть таких, при обработке которых предполагается, что двоичная запятая находится справа от числа. Если считать, что двоичная запятая располагается справа от знакового разряда, определяя дробное значение, то в систе­ме дополнения до двух значение числа со знаком F, представленного n-разрядной двоичной дробью

В= b0,b-1,b-2 ...b-(n-1)

определяется функцией

F(B) =  -b0 20 + b-1 2-1  + b-2 2-2 +...+ b-(n-1) 2-(n-1) 

где значение F лежит в диапазоне

-1 ≤ F ≤ 1 - 2-(n-1)

Рассмотрим диапазон значений, которые можно представить в 32-разрядном формате с фиксированной запятой. Если интерпретировать их как целые числа, получается диапазон от 0 до ±2,15 109, а если как дроби — диапазон от ±4.55 10-10 до ±1. Ни одного из этих диапазонов не достаточно для научных вычисле­ний, в которых могут использоваться такие параметры, как число Авогадро (6,0247 х 1023 моль-1) и константа Планка (6,6254 х 10-27 эрг с). Необходим такой формат, который подходил бы и для очень больших целых, и для очень малень­ких дробных чисел. Для этого компьютер должен уметь представлять числа и оперировать ими таким образом, чтобы позиция двоичной запятой была перемен­ной и автоматически изменялась в процессе вычислений. Такие числа называют числами с плавающей запятой. Напомним, что в числах с фиксированной запятой двоичная запятая всегда располагается в одной и той же позиции.

Поскольку в числе с плавающей запятой позиция двоичной запятой перемен­ная, она должна быть явно задана в представлении числа. Так, в хорошо знакомом вам научном десятичном формате числа могут записываться как 6,0247 х 1023, 6,6254 х 10-27, -1,0341 х 102, -7,3000 х 10-14 и т. д. Говорят, что в этих числах по пять значащих цифр. Масштабные множители (1023, 10-27 и т. д.) указывают по­зицию десятичной запятой по отношению к значащим цифрам. Числа, в которых десятичная запятая расположена справа от первой (ненулевой) значащей цифры, называют нормализованными. Основание масштабного множителя (10), которое является фиксированным, в машинном представлении чисел с плавающей запя­той можно не задавать. Итак, число с плавающей запятой должно содержать знак, значащие цифры и показатель степени 10 в масштабном множителе.

Теперь мож­но дать точное определение машинного представления числа с плавающей запя­той: оно состоит из знака, строки значащих цифр, называемой мантиссой, и пока­зателя степени (фиксированного основания), называемого порядком.

4.3.1. Стандарт IEEE для чисел с плавающей запятой

Сначала рассмотрим в общих чертах представление чисел с плавающей запятой в десятичной системе счисления, а затем соотнесем это представление с двоичным. Итак, числа с плавающей запятой удобно записывать следующим образом:

± Х1, Х2, Х3, Х4,X5, Х6, Х7, х 10±Y1 Y2

Здесь Хiи Yi это десятичные цифры. Такого количества значащих цифр (7) и диапазона значений порядка (±99) достаточно для научных расчетов. Мантиссу и порядок из этих диапазонов можно перевести в двоичное представление, уме­щающееся в 32 разряда, то есть в стандартное компьютерное слово. Мантисса длиной 24 бита может представлять десятичное число из 7 цифр, а 8-битовый по­рядок подразумеваемого основания 2 позволяет представить достаточно широ­кий диапазон значений масштабных множителей. Для знака числа необходим один бит. Поскольку ведущий бит нормализованной мантиссы обязательно дол­жен быть равен 1, его можно не включать в представление, за счет чего и освобож­дается один бит для знака. Таким образом, 32 бита позволяют представить доста­точно широкий диапазон чисел с плавающей запятой.

Описанный стандарт представления чисел с плавающей запятой в 32-разряд­ном формате разработан и детально специфицирован Институтом инженеров по электротехнике и электронике (Institute of Electrical and Electronics Engineers, IEEE). В нем определены и представление чисел, и правила выполнения четырех базовых арифметических операций. На рис. 4.4 а продемонстрировано 32-раз­рядное представление чисел с плавающей запятой. Знак числа задается в первом разряде, за ним следует представление порядка (по основанию 2). Вместо числа со знаком в поле порядка E хранится целое число без знака E' = E + 127. Этот формат называется форматом, с избытком 127. Таким образом, E' входит в диапа­зон        0≤Е’≤255. Граничные значения указанного диапазона, 0 и 255, употребляют­ся для представления описанных ниже специальных значений. Для обычных (нормальных) значений E' лежит в пределах 1≤ E’≤254. Это означает, что реаль­ный порядок, E, находится в диапазоне -126 ≤ E ≤ 127. Представление порядка в формате с избытком х упрощает, сравнение относительного размера двух чисел с плавающей запятой.

Последние 23 разряда числа представляют мантиссу. Поскольку числа зада­ются в нормализованном виде, старший бит мантиссы всегда равен 1. Этот бит не указывается явно; подразумевается, что он располагается слева от двоичной запя­той. Таким образом, 23 бита в поле M соответствуют дробной части мантиссы, то есть разрядам справа от двоичной запятой. Пример числа с плавающей запятой одинарной точности приведен на рис. 4.4, б.

Стандартное 32-разрядное представление (рис. 4.4, а) называется представле­нием с одинарной точностью, поскольку занимает одно 32-разрядное слово. Оно позволяет представлять масштабные множители в диапазоне от 2-126 до 2+127, что приблизительно равно 10±38. Значение 24-разрядной мантиссы обеспечивает при­мерно ту же точность, что и семизначное десятичное значение. Для достижения большей точности и увеличения диапазона чисел с плавающей запятой стандарт IEEE определяет формат двойной точности (рис. 4.4, в). В нем расширены диа­пазоны значений мантиссы и порядка. Так, 11-разрядный порядок в формате с избытком 1023 E’ лежит в диапазоне 1 Е' ≤ 2046 для обычных значений, а значе­ния 0 и 2047 употребляются для представления специальных символов. Следова­тельно, действительный порядок E лежит в диапазоне -1022 E 1023, позво­ляющем представить масштабные множители от 2-1022 до 21023 (то есть приблизи­тельно 10±308). Значения 53-разрядной мантиссы обеспечивают практически ту же точность, что и 16 десятичных цифр.

Чтобы компьютер соответствовал стандарту IEEE, он должен поддерживать как минимум представление чисел с плавающей запятой одинарной точности. Представление двойной точности необязательно. Этот стандарт определяет еще несколько необязательных расширенных версий обоих форматов. Они предна­значены для повышения точности и порядка представления промежуточных ре­зультатов последовательных вычислений. Например, внутреннее произведение двух векторов можно вычислить путем накопления суммы произведений с рас­ширенной точностью. Входные значения имеют стандартную точность, одинар­ную или двойную; результат округляется до той же точности. Благодаря расши­ренным форматам можно сократить погрешность округления, которая накапли­вается при многократных однотипных вычислениях. Кроме того, расширенные форматы повышают точность вычисления таких элементарных функций, как си­нус, косинус и т. п. Наряду с четырьмя базовыми арифметическими операциями стандарт IEEE определяет операции вычисления остатка от деления, квадратного корня, преобразования из двоичного кода в десятичный и наоборот.

        Знак      8-разрядный                   23-разрядная дробная

числа     порядок со знаком                    часть мантиссы

                           в формате

      с избытком 127

Представленное значение =±l.M х 2E’-127

а

Представленное значение =1,001010 ... 0 х 2-87

б

  Знак      11-разрядный                         52-разрядная

Числа порядок в формате              дробная часть мантиссы

с избытком 1023

Представленное значение =±l.М х 2Е’-1023

в

Рис. 4.4. Представления чисел с плавающей запятой, определенные в стандарте IEEE: формат числа с одинарной точностью (а); пример числа с одинарной точностью (б); формат числа с двойной точностью (в)

 

Порядок в формате с избытком 127

(Слева от двоичной запятой нет явно заданной 1)

Представленное значение = +0,0010110... х 29

а

Представленное значение = +1,0110... х 26

б

Рис. 4.5. Число с плавающей запятой в формате IEEE одинарной точности:

ненормализованное (а); нормализованное (б)

Существует два момента, касающихся чисел с плавающей запятой, которые заслуживают особого внимания.

Во-первых, если число не нормализовано, его всегда можно привести к нормальной форме, сдвинув дробную часть и соответст­вующим образом изменив порядок. На рис. 4.5 вы видите ненормализованное значение 0,0010110... х 29 и его нормализованное представление 1,0110... х 26. По­скольку масштабный множитель представлен в формате 2i, сдвиг мантиссы на один разряд вправо или влево компенсируется увеличением или уменьшением порядка на единицу.

Во-вторых, в ходе вычислений может быть сгенерировано число, выходящее за рамки диапазона нормальных чисел. Если точность одинар­ная, это означает, что для представления нормализованного числа потребуется по­рядок менее -126 или более +127. В первом случае говорят о потере значимости или отрицательном переполнении (underflow), а во втором — о переполнении (overflow). И потеря значимости, и переполнение являются арифметическими исключениями, о которых мы поговорим чуть позже.

Специальные значения

Граничные значения 0 и 255 порядка Е' формате с избытком 127 используются для представления специальных значений. Если E' = 0 и дробная часть мантиссы M равна нулю, значит, представлено точное значение 0. Порядок E' = 255 и ман­тисса M = 0 представляют значение ∞, где ∞ — результат деления нормального числа на нуль. Для представления этих значений обычно применяется и знако­вый разряд, например: ±0 и ±∞.

Значения Е' = 0 и М ≠ 0 соответствуют представлению анормальных чисел. Это числа ±0,М х 2-126, которые меньше самого маленького числа. У них отсутствует подразумеваемая единица слева от двоичной запятой, a M представляет собой любую ненулевую 23-разрядную дробную часть числа. Анормальные числа пред­назначены для случаев, когда возможна постепенная потеря значимости; они расширяют диапазон представляемых чисел и могут быть полезны при работе с очень маленькими числами. Когда E'=255 и M ≠ 0, представленное значение на­зывается Not a Number (NaN). Значение NaN является результатом выполнения недопустимой операции, такой как 0/0 или √-1.

Исключения

Согласно стандарту IEEE, если в ходе работы произойдет потеря значимости, пере­полнение или деление на нуль, встретится условие inexact либо invalid, процессор должен установить флаг исключения. О первых трех условиях исключений мы уже упоминали. Inexact — это ситуация, когда для представления результата в одном из нормальных форматов его необходимо округлить. Термин invalid употребляется для описания ситуации, когда предпринимается попытка выполнения недопусти­мой операции, такой как 0/0 или √-1. При возникновении одной из указанных ис­ключительных ситуаций результату присваивается специальное значение.

Если установлен флаг разрешения соответствующего прерывания, в исключи­тельной ситуации происходит переход к системной или пользовательской програм­ме обработки этого прерывания. В качестве альтернативы прикладная программа может сама проверять, нет ли исключений, и производить те или иные операции в соответствии с результатами проверки.

4.3.2. Арифметические операции над числами с плавающей запятой

Этот раздел посвящен правилам сложения, вычитания, умножения и деления чи­сел в формате с плавающей запятой, определенном стандартом IEEE. Указанные правила регулируют только базовые шаги при выполнении операций. А вот, на­пример, возможность переполнения или потери значимости в них не учтена. Бо­лее того, для промежуточных значений мантиссы и порядка может потребоваться более 24 и 8 бит соответственно. Эти и другие особенности операций с плаваю­щей запятой нужно принимать к сведению в процессе разработки арифметиче­ских устройств, соответствующих стандарту IEEE. Все особенности мы, конечно, не рассмотрим, но о важнейших, таких как округление, поговорим обязательно.

Если порядок двух операндов с плавающей запятой различен, их мантиссы пе­ред сложением или вычитанием должны быть сдвинуты относительно друг друга. В качестве примера рассмотрим сложение чисел 2,9400 х 102 и 4,3100 х 104. Пред­ставим 2,9400 х 102 как 0,0294 х 104 и сложим мантиссы, вследствие чего получим 4,3394 х 104. Последовательность операций при сложении и вычитании можно описать следующим образом.

Правило сложения и вычитания

1. Выбрать число с меньшим порядком и сдвинуть его мантиссу вправо на количество разрядов, равное разности порядков.

2. Установить порядок результата равным большему порядку операндов.

3. Выполнить сложение/вычитание мантисс и определить знак результата.

4. Нормализовать результат в случае необходимости.

Умножение и деление чисел с плавающей запятой даже проще их сложения и вычитания — для выполнения этих операций выравнивать мантиссы не требуется.

Правило умножения

1. Сложить порядки операндов и вычесть из результата значение 127.

2. Перемножить мантиссы и определить знак результата.

3. В случае необходимости нормализовать результат.

Правило деления

1. Вычесть порядок делителя из порядка делимого и прибавить к результату значение 127.

2. Разделить мантиссы и определить знак результата.

3. В случае необходимости нормализовать результат.

Прибавление или вычитание 127 при умножении и делении выполняется по­тому, что порядки чисел представлены в формате с избытком 127.

4.3.3. Точность вычислений. Разряды защиты и усечение

Реализация описанных алгоритмов имеет ряд важных особенностей, обзор кото­рых дан в настоящем разделе. Хотя размер мантисс исходных операндов и конеч­ного результата ограничен 24 разрядами, включая подразумеваемую ведущую 1, важно, чтобы в ходе промежуточных вычислений сохранялось несколько допол­нительных разрядов, называемых разрядами защиты или сторожевыми разряда­ми. Это позволяет обеспечить необходимую точность конечного результата.

Когда разряды защиты удаляются из конечного результата, мантисса усекается до 24 разрядов. Усечение производится и в других ситуациях, в частности, при пре­образовании десятичного числа в двоичный формат. Конечно, для обозначения данной операции употребляется также термин округление, но мы будем использо­вать его в более узком смысле, говоря об одном из способов усечения значения.

Существует несколько способов усечения. Простейший из них заключается в удалении разрядов защиты без изменения остальных разрядов. Такая операция называется усечением. Предположим, что необходимо сократить дробное значение с шести разрядов до трех. Любые значения, лежащие в диапазоне  от  0,b-1b-2b-3000  до  0,b-1b-2b-3111,  усекаются  до 0,b-1b-2b-3. Ошибка усечения до 3-разрядного ре­зультата находится в диапазоне 0 − 0,000111, то есть от 0 и почти до 1 в младшем из оставшихся разрядов. У нас это разряд b-3. В результате усечения получается сме­щенное приближение, поскольку диапазон ошибки не симметричен нулю.

Еще одним простым методом усечения является фон-неймановское округление. Если все удаляемые разряды содержат нули, последние отбрасываются без изме­нения оставшихся разрядов. Но если хоть один из удаляемых разрядов содержит 1, младший разряд оставшегося значения устанавливается в 1. В нашем примере усечения дробного значения с шести разрядов до трех любые 6-разрядные значе­ния, в которых b-4b-5b-6 не равны 000, укорачиваются до 0,b-1b-21. Величина ошибки этого метода лежит в диапазоне от -1 до +1 младшего из оставшихся раз­рядов. И хотя при таком способе усечения значения диапазон ошибки больше, чем при простом усечении, ее максимальная величина остается той же, а прибли­жение получается несмещенным, так как диапазон ошибки симметричен относи­тельно нуля.

 Для тех операций, в которых участвует много операндов и выполняется значи­тельное количество промежуточных действий, предпочтительнее несмещенное при­ближение, при котором положительные и отрицательные ошибки компенсируют друг друга. Если статистически оценить результаты сложных вычислений с ис­пользованием несмещенного приближения, их точность окажется очень высокой.

Перейдем к следующему методу усечения значения — округлению. Задача ок­ругления состоит в максимальном приближении результирующего значения к ис­ходному. Оно гораздо точнее полученного путем усечения и к тому же дает несме­щенный результат. Округление выполняется так: если старший из удаляемых разрядов содержит 1, к младшему из оставшихся разрядов числа прибавляется 1. Таким образом, 0,b-1b-2b-31- округляется до 0,b-1b-2b-3+0,001, а 0,b-1b-2b-30... — до 0,b-1b-2b-3. Результат получается предельно близким к исходному числу за ис­ключением ситуации, когда удаляемые разряды равны 10...0. В этом случае исход­ное значение лежит посредине между двумя возможными усеченными представле­ниями. Для обеспечения несмещенного приближения можно выбирать значение младшего из оставшихся разрядов таким образом, чтобы всегда получалось бли­жайшее четное значение.

В рассматриваемом примере с использованием 6 разря­дов значение 0,b-1b-20100 округляется до 0,b-1b-20, a 0,b-1b-21100— до 0,b-1b-21+ 0,001. Эту технологию можно описать так: округление до ближайшего числа, а в случае двух одинаковых ошибок округления — до ближайшего четного числа.

Ошибка округления лежит в диапазоне от -1/2 до +1/2 значения младшего из оставшихся разрядов. Очевидно, что это наилучший метод. Однако реализовать его труднее всего, поскольку потребуется дополнительная операция и, возможно, нормализация. Согласно стандарту IEEE, для усечения чисел по умолчанию ис­пользуется округление. В этом стандарте описаны и другие методы усечения; все они определены как режимы округления.

Обсуждая ошибки, возникающие из-за удаления разрядов защиты, мы говори­ли об одной операции усечения. Если программа выполняет длинную последова­тельность вычислений, в которой задействованы числа с плавающей запятой, анализ диапазонов ошибок и конечных результатов значительно усложняется. Этот аспект числовых вычислений мы больше обсуждать не будем, а напоследок еще раз обратимся к стандарту IEEE и посмотрим, как в нём определяются разря­ды защиты и округление.

Результаты одной операции должны вычисляться с точностью до половины единицы в младшем разряде. В общем случае с этой целью результат должен уко­рачиваться путем округления. Для обеспечения такой точности на промежуточ­ных шагах выполнения операции достаточно сохранять три разряда защиты. Пер­вые два — это старшие разряды мантиссы, которые в конце вычислений подлежат удалению. Третий разряд содержит результат выполнения логической операции ИЛИ всех разрядов мантиссы, кроме указанных двух разрядов защиты. Поддер­живать его на промежуточных шагах операции достаточно просто. Он инициали­зируется нулем, а когда в него из мантиссы выдвигается 1,становится равным 1 и сохраняет это значение. Поэтому данный разряд иногда называют вторым проме­жуточным битом округления (sticky bit).

Память и адреса

Числовые и символьные операнды, равно как и команды, хранятся в памяти ком­пьютера. Память состоит из многих миллионов ячеек, в каждой из которых содер­жится один бит информации, имеющий значение 0 или 1. Поскольку один бит способен представить очень маленькое количество информации, биты редко обра­батываются поодиночке. Как правило, их обрабатывают группами фиксированного размера. Для этого память организуется таким образом, что группы по n бит могут записываться и считываться за одну базовую операцию. Группа из n бит называ­ется словом информации, а значение n — длиной слова. Схематически память ком­пьютера можно представить в виде набора слов (рис. 4.6).

Длина слова современных компьютеров составляет от 16 до 64 бит. Если дли­на слова компьютера равна 32 битам, в одном слове может храниться 32-разряд­ное число в системе дополнения до двух или четыре символа ASCII, занимающих по 8 бит (рис. 4.7). Восемь идущих подряд битов называются байтом. Для пред­ставления машинной команды требуется одно или несколько слов. О кодирова­нии машинных команд мы поговорим далее в этой главе, после того как обсудим команды на уровне языка ассемблера.

Рис. 4.6. Слова памяти

Рис. 4.7. Примеры закодированной информации в 32-разрядном слове:

целое число со знаком (а); четыре символа (б)

Для доступа к памяти с целью записи или чтения отдельных элементов ин­формации, будь то слова или байты, необходимы имена или адреса, определяю­щие их расположение в памяти. В качестве адресов традиционно используются числа из диапазона от 0 до 2k-1 со значением k, достаточным для адресации всей памяти компьютера. Все 2k адресов составляют адресное пространство компью­тера. Следовательно, память состоит из 2k адресуемых элементов. Например, ис­пользование 24-разрядных адресов позволяет адресовать 224 (16777216) элемен­тов памяти. Обычно это количество адресуемых элементов обозначается как 16 M (16 мега), где 1 М - 220 (1048576). 32-разрядным адресам соответствует адресное пространство из 232, или 4 Г (4 гига), элементов, где 1 Г - 230. Кроме того, часто используются обозначения К (кило), соответствующее 210 (1024), и Т (тера), со­ответствующее 240.

Байтовая адресация

Итак, у нас есть три основные единицы информации: бит, байт и слово. Байт все­гда равен 8 битам, а длина слова обычно колеблется от 16 до 64 бит. Отдельные биты, как правило, не адресуются. Чаще всего адреса назначаются байтам памяти. Именно так адресуется память большинства современных компьютеров, и имен­но этот способ адресации мы будем использовать в этой книге. Память, в которой каждый байт имеет отдельный адрес, называется памятью с байтовой адресаци­ей. Последовательные байты имеют адреса 0, 1, 2 и т. д. Таким образом, при ис­пользовании слов длиной 32 бита последовательные слова имеют адреса 0,4,8,..., и каждое слово состоит из 4 байт.


Дата добавления: 2018-02-18; просмотров: 1107; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!