Обозначения и сокращения



Нормативные ссылки

В настоящем отчете о выполненной учебно-исследовательской лабораторной работе «Исследование текстового документа» (электронная копия: Petrov_123_Otchet01.doc, вариант 35) использованы ссылки на следующие стандарты

ГОСТ 3.72-2001 Отчет о научно-исследовательской работе. Структура и правила оформления.

ГОСТ 8.417—81 Государственная система обеспечения единства измерений. Единицы физических величин.

ГОСТ Р 50922—96 Защита информации. Основные термины и определения.

ISO 17799 Управление информационной безопасностью. Практические правила.

Определения

В настоящем отчете о выполненной учебно-исследовательской лабораторной работе применяют следующие термины с соответствующими определениями.

Информация – сведения о лицах, предметах, фактах, событиях, явлениях и процессах независимо от формы их представления (национальный российский стандарт ГОСТ Р 50922—96).

Информация - смысл, который в настоящее время придается данным, посредством соответствующих соглашений (международный стандарт ISO 17799).

Информация – это продукт взаимодействия данных и адекватного им методов /1/.

Удельная память – объем памяти, требуемой для хранения текста и служебной информации Word’а, деленный на количество хранимых символов этого текста (байт/символ).

Приведенная удельная память - на сколько увеличится объем требуемой для хранения памяти, если текст увеличится на один символ (байт/символ). Служебная информация Word’а не учитывается.

 

 

Обозначения и сокращения

б бит, один двузначный разряд
Б байт, восемь двузначных разряда
Кб килобайт, 210 байт = 1024 байта
Мб мегабайт, 220 байт
Гб гигабайт, 230 байт
Тб терабайт, 240 байт
S количество символов
Z емкость запоминающего устройства, требуемая для хранения файла
u удельная память (байт/символ), включает память для служебной информации Word’а.
pu приведенная удельная память (байт/символ), на сколько увеличится объем требуемой для хранения памяти, если текст увеличится на один символ
MS Microsoft

 


 

Введение

Согласно работам Симоновича /1/ данные – диалектическая составная часть информации. Они представляют собой зарегистрированные сигналы. При этом физический метод регистрации может быть любым: механическим, электрическим, магнитным, оптическим, химическим и т.д., либо их комбинациями и сочетаниями. В соответствии с методами регистрации данные могут храниться и транспортироваться на носителях различных видов.

Задача преобразования данных с целью смены носителя относится к одной из важнейших задач информатики. В структуре стоимости вычислительных систем устройства для ввода и вывода данных, работающих с различными носителями, составляют до половины стоимости аппаратных средств.

В ходе информационного процесса данные преобразуются из одного вида в другой с помощью методов. Обработка данных включает в себя множество различных операций. По мере развития научно-технического прогресса и общего усложнения связей в человеческом обществе трудозатраты на обработку данных неуклонно возрастают.

В структуре возможных операций с данными в качестве основных выделяются:


· сбор;

· формализация;

· фильтрация;

· сортировка;

· архивация;

· хранение;

· защита;

· транспортировка;

· преобразование.


Очевидно, что работа с информацией может иметь огромную трудоемкость, и ее надо автоматизировать.

Для автоматизации работы с данными, относящимся к различным типам, очень важно унифицировать их форму представления – для этого обычно используется прием кодирования, то есть выражение данных одного типа через данные другого типа.

Проблема универсального средства кодирования достаточно успешно реализуется в отдельных отраслях техники, науки, культуры. В качестве примеров можно привести систему записи математических формул, телеграфную азбуку, систему Брайля и многое другое.

В вычислительно технике существует своя система, которая называется двоичным кодированием. Она основана на представлении данных последовательностью всего двух знаков: 0 и 1. Эти знаки называются двоичными цифрами, по-английски – binary digit или сокращенно bit (бит).

При хранении текстовых данных важной характеристикой является компактность хранения. Очевидно, что она зависит от способа кодирования. Существуют различные стандартные базовые таблицы кодировок текстовых символов, наибольшее распространение из которых нашли ASCII, КОИ-8 и Windows 1251.

Вызывает интерес 16-разрядная система кодирования символов, получившая название UNICODE. Поскольку она позволяет использовать 65536 двоичных комбинаций, снимаются проблемы представления символов большинства языков (алфавитов) планеты.

Для облегчения работы с кодированными текстами обычно используются специальные программы, называемые текстовыми процессорами, текстовыми редакторами и т.п. Наибольшее распространение получил текстовый редактор Microsoft Word, входящий составной частью в пакет программ Microsoft Office. Простота и удобство работы с Word обеспечили его международное признание. Однако за удобства работы приходится расплачиваться. В частном случае в качестве такой платы выступает повышенный расход памяти, требуемой для хранения документа в формате Word.

Целью предлагаемого исследования является определение требуемой относительной (удельной) емкости памяти для одного символа, используемого в текстовом редакторе Microsoft Word при хранении комплексного документа в формате Word.


 


Дата добавления: 2015-12-17; просмотров: 45; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!