В последние годы ОС Linux продемонстрировала огромные успехи в повышении производительности системных вызовов и файловой системы. Для сравнения аналогичный тест с применением ядра 2.6 занял чуть менее 14 секунд:
$ TIMEFORMAT="" time ./copy_system
2.08user 10.59system 0:13.74elapsed 92%CPU
...
Упражнение 3.2. Вторая версия программы кодирования файла
Вы можете добиться лучших результатов, копируя блоки большего размера. Взгляните на модифицированную программу copy_block.c, которая копирует файл блоками в 1 Кбайт и снова использует системные вызовы.
#include <unistd.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <stdlib.h>
int main {
char block[1024];
int in, out;
int nread;
in = open("file.in", O_RDONLY);
out = open("file.out", O_WRONLY|O_CREAT, S_IRUSR|S_IWUSR);
испытайте программу, но сначала удалите старый выходной файл.
$ rm file.out
$ TIMEFORMAT="" time ./copy_block
0.00user 0.02system 0:00.04elapsed 78%CPU
...
Как это работает
Теперь программа выполняется только сотые доли секунды, поскольку ей требуется около 2000 системных вызовов. Конечно, это время очень зависит от системы, но оно показывает, что системные вызовы сопряжены с поддающимися измерению издержками, поэтому их применение стоит оптимизировать.
Другие системные вызовы для управления файлами
Существует ряд других системных вызовов, оперирующих низкоуровневыми дескрипторами файлов. Они позволяют программе контролировать использование файла, возвращая информацию о его состоянии,
lseek
Системный вызов
lseek
задает указатель текущей позиции чтения/записи дескриптора файла, т.е. вы можете применять его для установки в файле места, с которого будет происходить следующее считывание или на которое будет производиться следующая запись. Вы можете задать указатель на абсолютную позицию файла или позицию, относительно текущего положения указателя или конца файла.
#include <unistd.h>
#include <sys/types.h>
off_t lseek(int fildes, off_t offset, int whence);
Параметр
offset
применяется для указания позиции, а параметр
whence
определяет способ применения
offset
и может принимать следующие значения:
SEEK_SET
—
offset
задает абсолютную позицию;
SEEK_CUR
—
offset
задается относительно текущей позиции;
SEEK_END
—
offset
задается относительно конца файла.
Вызов
lseek
возвращает величину параметра
offset
в байтах, измеряемую
от начала файла, для которого установлен указатель, или -1 в случае неудачного завершения. Тип данных
off_t
, применяемый для параметра
offset
в операциях поиска, — зависящий от реализации тип
integer
(целое), определенный в файле sys/types.h.
fstat, stat и lstat
Системный вызов
fstat
возвращает информацию о состоянии файла, ассоциированного с открытым дескриптором файла. Эта информация записывается в структуру
buf
, адрес которой передается как параметр.
Далее приведена синтаксическая запись вызовов.
#include <unistd.h>
#include <sys/stat.h>
#include <sys/types.h>
int fstat(int fildes, struct stat *buf);
int stat(const char *path, struct stat *buf);
int lstat(const char *path, struct stat *buf);
Примечание
Учтите, что включение файла sys/types.h не обязательное, но мы рекомендуем включать его при использовании системных вызовов, поскольку некоторые из их определений применяют для стандартных типов псевдонимы, которые могут измениться когда-нибудь.
Родственные функции
stat
и
lstat
возвращают информацию о состоянии названного файла. Они возвращают те же результаты за исключением того, что файл является символической ссылкой. Вызов
lstat
возвращает данные о самой ссылке, а вызов
stat
— о файле, на который ссылка указывает.
Элементы вызываемой структуры stat могут меняться в разных UNIX-подобных системах, но обязательно включают перечисленные в табл. 3.4 элементы.
Таблица 3.4
Элемент структуры
stat
Описание
st_mode
Права доступа к файлу и сведения о типе файла
st_ino
Индекс, ассоциированный с файлом
st_dev
Устройство, на котором размещен файл
st_uid
Идентификатор (user identity) владельца файла
st_gid
Идентификатор группы (group identity) владельца файла
st_atime
Время последнего обращения
st_ctime
Время последнего изменения прав доступа, владельца, группы или объема