Чтение и запись текстовых файлов



 

Проще всего считывать данные из текстового файла или записывать их в него с помощью операторов "<<" и ">>" . Например, в следующей программе выполняется запись в файл test целого числа, значения с плавающей точкой и строки.

 

 

Следующая программа считывает целое число, float‑значение, символ и строку из файла, созданного при выполнении предыдущей программой.

 

 

Следует иметь в виду, что при использовании оператора ">>" для считывания данных из текстовых файлов происходит преобразование некоторых символов. Например, "пробельные" символы опускаются. Если необходимо предотвратить какие бы то ни было преобразования символов, откройте файл в двоичном режиме доступа. Кроме того, помните, что при использовании оператора ">>" для считывания строки ввод прекращается при обнаружении первого "пробельного" символа.

 

Неформатированный ввод‑вывод данных в двоичном режиме

 

Форматированные текстовые файлы (подобные тем, которые использовались в предыдущих примерах) полезны во многих ситуациях, но они не обладают гибкостью неформатированных двоичных файлов. Поэтому C++ поддерживает ряд функций файлового ввода‑вывода в двоичном режиме, которые могут выполнять операции без форматирования данных.

Для выполнения двоичных операций файлового ввода‑вывода необходимо открыть файл с использованием спецификатора режима ios::binary . Необходимо отметить, что функции обработки неформатированных файлов могут работать с файлами, открытыми в текстовом режиме доступа, но при этом могут иметь место преобразования символов, которые сводят на нет основную цель выполнения двоичных файловых операций.

Функция get() считывает символ из файла, а функция put() записывает символ в файл.

В общем случае существует два способа записи неформатированных двоичных данных в файл и считывания их из файла. Первый состоит в использовании функции‑члена put() (для записи байта в файл) и функции‑члена get() (для считывания байта из файла). Второй способ предполагает применение "блочных" С++‑функций ввода‑вывода read() и write() . Рассмотрим каждый способ в отдельности.

 

Использование функций get() и put()

 

Функции get() и put() имеют множество форматов, но чаще всего используются следующие их версии:

 

 

Функция get() считывает один символ из соответствующего потока и помещает его значение в переменную ch . Она возвращает ссылку на поток, связанный с предварительно открытым файлом. При достижении конца этого файла значение ссылки станет равным нулю. Функция put() записывает символ ch в поток и возвращает ссылку на этот поток.

При выполнении следующей программы на экран будет выведено содержимое любого заданного файла. Здесь используется функция get() .

 

 

При достижении конца файла потоковый объект in примет значение ЛОЖЬ , которое остановит выполнение цикла while .

Существует более короткий вариант цикла, предназначенного для считывания и отображения содержимого файла.

 

 

Этот вариант также имеет право на существование, поскольку функция get() возвращает потоковый объект in , который при достижении конца файла примет значение false .

В следующей программе для записи строки в файл используется функция put() .

 

Считывание и запись в файл блоков данных

 

Чтобы считывать и записывать в файл блоки двоичных данных, используйте функции‑члены read() и write() . Их прототипы имеют следующий вид.

 

 

Функция read() считывает num байт данных из связанного с файлом потока и помещает их в буфер, адресуемый параметром buf . Функция write() записывает num байт данных в связанный с файлом поток из буфера, адресуемого параметром buf . Как упоминалось выше, тип streamsize определен как некоторая разновидность целочисленного типа. Он позволяет хранить самое большое количество байтов, которое может быть передано в процессе любой операции ввода‑вывода.

Функция read() вводит блок данных, а функция write() выводит его.

При выполнении следующей программы сначала в файл записывается массив целых чисел, а затем он же считывается из файла.

 

 

Обратите внимание на то, что в инструкциях обращения к функциям read() и write() выполняются операции приведения типа, которые обязательны при использовании буфера, определенного не в виде символьного массива.

Функция gcount() возвращает количество символов, считанных при выполнении последней операции ввода данных.

Если конец файла будет достигнут до того, как будет считано num символов, функция read() просто прекратит выполнение, а буфер будет содержать столько символов, сколько удалось считать до этого момента. Точное количество считанных символов можно узнать с помощью еще одной функции‑члена gcount() , которая имеет такой прототип.

 

 

Функция gcount() возвращает количество символов, считанных в процессе выполнения последней операции ввода данных.

 

Обнаружение конца файла

 

Обнаружить конец файла можно с помощью функции‑члена eof() , которая имеет такой прототип.

 

 

Эта функция возвращает значение true при достижении конца файла; в противном случае она возвращает значение false .

Функция eof() позволяет обнаружить конец файла.

В следующей программе для вывода на экран содержимого файла используется функция eof() .

 

Пример сравнения файлов

 

Следующая программа иллюстрирует мощь и простоту применения в C++ файловой системы. Здесь сравниваются два файла с помощью функций двоичного ввода‑вывода read() , eof() и gcount() . Программа сначала открывает сравниваемые файлы для выполнения двоичных операций (чтобы не допустить преобразования символов). Затем из каждого файла по очереди считываются блоки информации в соответствующие буферы и сравнивается их содержимое. Поскольку объем считанных данных может быть меньше размера буфера, в программе используется функция gcount() , которая точно определяет количество считанных в буфер байтов. Нетрудно убедиться в том, что при использовании файловых С++‑функций для выполнения этих операций потребовалась совсем небольшая по размеру программа.

 

 

Проведите эксперимент. Размер буфера в этой программе жестко установлен равным 1024 . В качестве упражнения замените это значение const ‑переменной и опробуйте другие размеры буферов. Определите оптимальный размер буфера для своей операционной среды.

 

Использование других функций двоичного ввода‑вывода

 

Помимо приведенного выше формата использования функции get() существуют и другие ее перегруженные версии. Приведем прототипы для трех из них, которые используются чаще всего.

 

 

Первая версия позволяет считывать символы в массив, заданный параметром buf , до тех пор, пока либо не будет считано num‑1 символов, либо не встретится символ новой строки, либо не будет достигнут конец файла. После выполнения функции get() массив, адресуемый параметром buf , будет иметь завершающий нуль‑символ. Символ новой строки, если таковой обнаружится во входном потоке, не извлекается. Он остается там до тех пор, пока не выполнится следующая операция ввода‑вывода.

Вторая версия предназначена для считывания символов в массив, адресуемый параметром buf , до тех пор, пока либо не будет считано num‑1 символов, либо не обнаружится символ, заданный параметром delim , либо не будет достигнут конец файла. После выполнения функции get() массив, адресуемый параметром buf , будет иметь завершающий нуль‑символ. Символ‑разделитель (заданный параметром delim ), если таковой обнаружится во входном потоке, не извлекается. Он остается там до тех пор, пока не выполнится следующая операция ввода‑вывода.

Третья перегруженная версия функции get() возвращает из потока следующий символ. Он содержится в младшем байте значения, возвращаемого функцией. Следовательно, значение, возвращаемое функцией get() , можно присвоить переменной типа char . При достижении конца файла эта функция возвращает значение EOF , которое определено в заголовке <iostream> .

Функцию get() полезно использовать для считывания строк, содержащих пробелы. Как вы знаете, если для считывания строки используется оператор ">>" , процесс ввода останавливается при обнаружении первого же пробельного символа. Это делает оператор ">>"  бесполезным для считывания строк, содержащих пробелы. Но эту проблему, как показано в следующей программе, можно обойти с помощью функции get(buf,num) .

 

 

Здесь в качестве символа‑разделителя при считывании строки с помощью функции get() используется символ новой строки. Это делает поведение функции get() во многом сходным с поведением стандартной функции gets() . Однако преимущество функции get() состоит в том, что она позволяет предотвратить возможный выход за границы массива, который принимает вводимые пользователем символы, поскольку в программе задано максимальное количество считываемых символов. Это делает функцию get() гораздо безопаснее функции gets() .

Рассмотрим еще одну функцию, которая позволяет вводить данные. Речь идет о функции getline() , которая является членом каждого потокового класса, предназначенного для ввода информации. Вот как выглядят прототипы версий этой функции,

 

 

Функция getline() представляет собой еще один способ ввода данных.

При использовании первой версии символы считываются в массив, адресуемый указателем buf , до тех пор, пока либо не будет считано num‑1 символов, либо не встретится символ новой строки, либо не будет достигнут конец файла. После выполнения функции getline() массив, адресуемый параметром buf , будет иметь завершающий нуль‑символ. Символ новой строки, если таковой обнаружится во входном потоке, при этом извлекается, но не помещается в массив buf .

Вторая версия предназначена для считывания символов в массив, адресуемый параметром buf , до тех пор, пока либо не будет считано num‑1 символов, либо не обнаружится символ, заданный параметром delim , либо не будет достигнут конец файла. После выполнения функции getline() массив, адресуемый параметром buf , будет иметь завершающий нуль‑символ. Символ‑разделитель (заданный параметром delim ), если таковой обнаружится во входном потоке, извлекается, но не помещается в массив buf .

Как видите, эти две версии функции getline() практически идентичны версиям get (buf, num) и get (buf, num, delim) функции get() . Обе считывают символы из входного потока и помещают их в массив, адресуемый параметром buf , до тех пор, пока либо не будет считано num‑1 символов, либо не обнаружится символ, заданный параметром delim . Различие между функциями get() и getline() состоит в том, что функция getline() считывает и удаляет символ‑разделитель из входного потока, а функция get() этого не делает.

Функция реек() считывает следующий символ из входного потока, не удаляя его.

Следующий символ из входного потока можно получить и не удалять его из потока с помощью функции реек() . Вот как выглядит ее прототип.

 

 

Функция peek() возвращает следующий символ потока, или значение EOF , если достигнут конец файла. Считанный символ возвращается в младшем байте значения, возвращаемого функцией. Поэтому значение, возвращаемое функцией реек() , можно присвоить переменной типа char .

Функция putback() возвращает считанный символ во входной поток.

Последний символ, считанный из потока, можно вернуть в поток, используя функцию putback() . Ее прототип выглядит так.

 

 

Здесь параметр с содержит символ, считанный из потока последним.

Функция flush() сбрасывает на диск содержимое файловых буферов.

При выводе данных немедленной их записи на физическое устройство, связанное с потоком, не происходит. Подлежащая выводу информация накапливается во внутреннем буфере до тех пор, пока этот буфер не заполнится целиком. И только тогда его содержимое переписывается на диск. Однако существует возможность немедленной перезаписи на диск хранимой в буфере информации, не дожидаясь его заполнения. Это средство состоит в вызове функции flush() . Ее прототип имеет такой вид.

 

 

К вызовам функции flush() следует прибегать в случае, если программа предназначена для выполнения в неблагоприятных средах (для которых характерны частые отключения электричества, например).

 

Произвольный доступ

 

До сих пор мы использовали файлы, доступ к содержимому которых был организован строго последовательно, байт за байтом. Но в C++ также можно получать доступ к файлу в произвольном порядке. В этом случае необходимо использовать функции seekg() и seekp() . Вот их прототипы.

 

 

Используемый здесь целочисленный тип off_type (он определен в классе ios) позволяет хранить самое большое допустимое значение, которое может иметь параметр offset . Тип seekdir определен как перечисление, которое имеет следующие значения.

 

 

Функция seekg() перемещает указатель, "отвечающий" за ввод данных, а функция seekp() – указатель, "отвечающий" за вывод.

В С++‑системе ввода‑вывода предусмотрена возможность управления двумя указателями, связанными с файлом. Эти так называемые cin ‑ и put ‑указатели определяют, в каком месте файла должна выполниться следующая операция ввода и вывода соответственно. При каждом выполнении операции ввода или вывода соответствующий указатель автоматически перемещается в указанную позицию. Используя функции seekg() и seekp() , можно получать доступ к файлу в произвольном порядке.

Функция seekg() перемещает текущий get ‑указатель соответствующего файла на offset байт относительно позиции, заданной параметром origin . Функция seekp() перемещает текущий put ‑указатель соответствующего файла на offset байт относительно позиции, заданной параметром origin .

В общем случае произвольный доступ для операций ввода‑вывода должен выполняться только для файлов, открытых в двоичном режиме. Преобразования символов, которые могут происходить в текстовых файлах, могут привести к тому, что запрашиваемая позиция файла не будет соответствовать его реальному содержимому.

В следующей программе демонстрируется использование функции seekp() . Она позволяет задать имя файла в командной строке, а за ним – конкретный байт, который нужно в нем изменить. Программа затем записывает в указанную позицию символ "X" . Обратите внимание на то, что обрабатываемый файл должен быть открыт для выполнения операций чтения‑записи.

 

 

В следующей программе показано использование функции seekg() . Она отображает содержимое файла, начиная с позиции, заданной в командной строке.

 

 

Функция tellg() возвращает текущую позицию get‑указателя, а функция tellp() – текущую позицию put‑указателя.

Текущую позицию каждого файлового указателя можно определить с помощью этих двух функций.

 

 

Здесь используется тип pos_type (он определен в классе ios), позволяющий хранить самое большое значение, которое может возвратить любая из этих функций.

Существуют перегруженные версии функций seekg() и seekp() , которые перемещают файловые указатели в позиции, заданные значениями, возвращаемыми функциями tellg() и tellp() соответственно. Вот как выглядят их прототипы,

 

Проверка статуса ввода‑вывода

 

С++‑система ввода‑вывода поддерживает статусную информацию о результатах выполнения каждой операции ввода‑вывода. Текущий статус потока ввода‑вывода описывается в объекте типа iostate , который представляет собой перечисление (оно определено в классе ios), включающее следующие члены.

 

 

Статусную информацию о результате выполнения операций ввода‑вывода можно получать двумя способами. Во‑первых, можно вызвать функцию rdstate() , которая является членом класса ios . Она имеет такой прототип.

 

 

Функция rdstate() возвращает текущий статус флагов ошибок. Нетрудно догадаться, что, судя по приведенному выше списку флагов, функция rdstate() возвратит значение goodbit при отсутствии каких бы то ни было ошибок. В противном случае она возвращает соответствующий флаг ошибки.

Во‑вторых, о наличии ошибки можно узнать с помощью одной или нескольких следующих функций‑членов класса ios .

 

 

Функция eof() рассматривалась выше. Функция bad() возвращает значение ИСТИНА, если в результате выполнения операции ввода‑вывода был установлен флаг badbit . Функция fail() возвращает значение ИСТИНА, если в результате выполнения операции ввода‑вывода был установлен флаг failbit . Функция good() возвращает значение ИСТИНА, если при выполнении операции ввода‑вывода ошибок не произошло. В противном случае они возвращают значение ЛОЖЬ.

Если при выполнении операции ввода‑вывода произошла ошибка, то, возможно, прежде чем продолжать выполнение программы, имеет смысл сбросить флаги ошибок. Для этого используйте функцию clear() (член класса ios), прототип которой выглядит так.

 

 

Если параметр flags равен значению goodbit (оно устанавливается по умолчанию), все флаги ошибок очищаются. В противном случае флаги устанавливаются в соответствии с заданным вами значением.

Прежде чем переходить к следующему разделу, стоит опробовать функции, которые сообщают данные о состоянии флагов ошибок, внеся в предыдущие примеры программ код проверки ошибок.

 

Использование перегруженных операторов ввода‑вывода при работе с файлами

 

Выше в этой главе вы узнали, как перегружать операторы ввода и вывода для собственных классов, а также как создавать собственные манипуляторы. В приведенных выше примерах программ выполнялись только операции консольного ввода‑вывода. Но поскольку все С++‑потоки одинаковы, одну и ту же перегруженную функцию вывода данных, например, можно использовать для вывода информации как на экран, так и в файл, не внося при этом никаких существенных изменений. Именно в этом и заключаются основные достоинства С++‑системы ввода‑вывода.

В следующей программе используется перегруженный (для класса three_d ) оператор вывода для записи значений координат в файл threed .

 

 

Если сравнить эту версию операторной функции вывода данных для класса three_d с той, что была представлена в начале этой главы, можно убедиться в том, что для "настройки" ее на работу с дисковыми файлами никаких изменений вносить не пришлось. Если операторы ввода и вывода определены корректно, они будут успешно работать с любым потоком.

Важно! Прежде чем переходить к следующей главе, не пожалейте времени и поработайте с С++‑функциями ввода‑вывода. Создайте собственный класс, а затем определите для него операторы ввода и вывода. А еще создайте собственные манипуляторы.

 


Дата добавления: 2018-09-22; просмотров: 394; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!