Чтение онлайн

на главную - закладки

Жанры

Linux программирование в примерах

Роббинс Арнольд

Шрифт:

5 #include <string.h>

6

7 int main(void)

8 {

9 #define STRBUFSIZE 1024

10 char locale[STRBUFSIZE], curloc[STRBUFSIZE];

11 char left[STRBUFSIZE], right[STRBUFSIZE];

12 char buf[BUFSIZ];

13 int count;

14

15 setlocale(LC_ALL, ""); /* установить локаль */

16 strcpy(curloc, setlocale(LC_ALL, NULL)); /* сохранить ее */

17

18 printf("--> "); fflush(stdout);

19 while (fgets(buf, sizeof buf, stdin) != NULL) {

20 locale[0] = '\0';

21 count = sscanf(buf, "%s %s %s", left, right, locale);

22 if (count < 2)

23 break;

24

25 if (*locale) {

26 setlocale(LC_ALL, locale);

27 strcpy(curloc, locale);

28 }

29

30 printf("%s: strcmp(\"%s\", \"%s\") is %d\n", curloc, left,

31 right, strcmp(left, right));

32 printf("%s: strcoll(\"%s\", \"%s\") is %d\n", curloc, left,

33 right, strcoll(left, right));

34

35 printf("\n--> "); fflush(stdout);

36 }

37

38 exit(0);

39 }

Программа

читает входные строки, состоящие из двух сравниваемых слов и необязательной локали, использующейся для сравнения. Если локаль дана, она становится локалью для последующих элементов. Программа начинает с любой локалью, которая установлена в окружении.

Массив

curloc
сохраняет текущую локаль для вывода результатов;
left
и
right
являются левым и правым сравниваемыми словами (строки 10–11). Основную часть программы составляет цикл (строки 19–36), который читает строки и выполняет работу. Строки 20–23 разделяют входную строку,
locale
инициализируется пустой строкой, если третья строка не предусмотрена.

Строки 25–28 устанавливают новую локаль, если она приведена. Строки 30–33 выводят результаты сравнения, а строка 35 приглашает для дальнейшего ввода. Вот демонстрация:

$ ch13-compare /* Запуск программы */

– -> ABC abc /* Ввести два слова */

С: strcmp("ABC", "abc") is -1 /* Программа началась в локали "С" */

С: strcoll("ABC", "abc") is -1 /* В локали "С" идентичные рез-ты */

– -> ABC abc en_US /* Слова те же, локаль "en_US" */

en_US: strcmp("ABC", "abc") is -1 /* strcmp без изменений */

en_US: strcoll("ABC", "abc") is 2 /* рез-ты strcoll изменились' */

– -> ABC abc en_US.UTF-8 /* Слова те же, локаль "en_US.UTF-8" */

en_US.UTF-8: strcmp("ABC", "abc") is -1

en_US. UTF-8: strcoll("ABC", "abc") is 6

 /* Другое значение, все еще положительное */

– -> junk JUNK /*
Новые слова */

en_US.UTF-8: strcmp("junk", "JUNK") is 1 /* предыдущая локаль */

en_US.UTF-8: strcoll("junk", "JUNK") is -6

Эта программа ясно показывает различие между

strcmp
и
strcoll
. Поскольку
strcmp
работает в соответствии с числовыми значениями символов, она всегда возвращает тот же самый результат,
strcoll
понимает проблемы сортировки, и ее результат меняется в соответствии с локалью. Мы видим, что в обеих локалях
en_US
заглавные буквы идут после строчных.

ЗАМЕЧАНИЕ. Специфическая для локали сортировка строк является проблемой также и для сопоставления регулярных выражений. Регулярные выражения допускают диапазоны символов внутри выражений со скобками, такие, как '

[a-z]
' или '
["-/]
'. Точное значение такой конструкции (символы, численно располагающиеся между начальной и конечной точками включительно) определено лишь для локалей «С» и «POSIX»

Для локалей, не являющихся ASCII, такие диапазоны как '

[a-z]
' могут соответствовать также и заглавным буквам, а не только строчным! Диапазон '
["-/]
' действителен в ASCII, но не в "
en_US.UTF-8
".

Долговременным наиболее переносимым решением является использование классов символов POSIX, таких, как '

[[:lower:]]
' и '
[[:punct:]]
'. Если вам кажется, что нужно использовать выражения с диапазонами на системах, использующих локали, и на более старых системах, не использующих их, без изменения своей программы, решение заключается в применении грубой силы и индивидуальном перечислении каждого символа внутри скобок. Это неприятно, но это работает.

Основанная на локалях сортировка потенциально дорогостоящая. Если вы ожидаете большого числа сравнений, где по крайней мере одна из строк не будет изменяться или где значения строк будут сравниваться друг с другом по несколько раз (как при сортировке списка), следует рассмотреть использование функции

strxfrm
для преобразования своих строк для использования с
strcmp
. Функция
strxfrm
объявлена следующим образом:

#include <string.h> /* ISO С */

size_t strxfrm(char *dest, const char *src, size_t n);

Идея в том, что

strxfrm
преобразует первые n символов
src
, помещая их в
dest
. Возвращаемое значение является числом символов, необходимых для сохранения преобразованных символов. Если она превышает n, содержимое
dest
«неопределенно».

Стандарт POSIX явным образом разрешает устанавливать в

n
ноль, а в
dest NULL
. В этом случае
strxfrm
возвращает размер массива, необходимого для сохранения преобразованной версии
src
(не включая завершающий символ '
\0
'). Предполагается, что это значение впоследствии будет использовано с
malloc
для создания массива
dest
или для проверки размера предопределенных границ массива (При этом, очевидно,
src
должен иметь завершающий нулевой байт.) Этот фрагмент иллюстрирует использование
strxfrm
:

Поделиться:
Популярные книги

Кодекс Охотника. Книга XXXIII

Винокуров Юрий
33. Кодекс Охотника
Фантастика:
попаданцы
аниме
фэнтези
фантастика: прочее
5.00
рейтинг книги
Кодекс Охотника. Книга XXXIII

Офицер

Земляной Андрей Борисович
1. Офицер
Фантастика:
боевая фантастика
7.21
рейтинг книги
Офицер

Черный Маг Императора 18

Герда Александр
18. Черный маг императора
Фантастика:
юмористическое фэнтези
аниме
сказочная фантастика
фэнтези
фантастика: прочее
попаданцы
5.00
рейтинг книги
Черный Маг Императора 18

Я еще барон. Книга III

Дрейк Сириус
3. Дорогой барон!
Фантастика:
боевая фантастика
попаданцы
аниме
5.00
рейтинг книги
Я еще барон. Книга III

Телохранитель Генсека. Том 4

Алмазный Петр
4. Медведев
Фантастика:
попаданцы
альтернативная история
6.00
рейтинг книги
Телохранитель Генсека. Том 4

Изгой Проклятого Клана. Том 4

Пламенев Владимир
4. Изгой
Фантастика:
аниме
фэнтези
фантастика: прочее
попаданцы
5.00
рейтинг книги
Изгой Проклятого Клана. Том 4

Возмутитель спокойствия

Владимиров Денис
1. Глэрд
Фантастика:
фэнтези
боевая фантастика
попаданцы
5.00
рейтинг книги
Возмутитель спокойствия

Матабар IV

Клеванский Кирилл Сергеевич
4. Матабар
Фантастика:
фэнтези
5.00
рейтинг книги
Матабар IV

Бастард Императора. Том 7

Орлов Андрей Юрьевич
7. Бастард Императора
Фантастика:
городское фэнтези
попаданцы
аниме
фэнтези
5.00
рейтинг книги
Бастард Императора. Том 7

Путь Шедара

Кораблев Родион
4. Другая сторона
Фантастика:
боевая фантастика
6.83
рейтинг книги
Путь Шедара

Зодчий. Книга IV

Погуляй Юрий Александрович
4. Зодчий Империи
Фантастика:
аниме
фэнтези
попаданцы
7.00
рейтинг книги
Зодчий. Книга IV

Сильнейший ученик. Том 2

Ткачев Андрей Юрьевич
2. Пробуждение крови
Фантастика:
фэнтези
попаданцы
аниме
5.00
рейтинг книги
Сильнейший ученик. Том 2

Двойник Короля 7

Скабер Артемий
7. Двойник Короля
Фантастика:
аниме
фэнтези
фантастика: прочее
попаданцы
5.00
рейтинг книги
Двойник Короля 7

Школа пластунов

Трофимов Ерофей
Одиночка
Фантастика:
боевая фантастика
5.00
рейтинг книги
Школа пластунов