ИМЯ locale - описание поддержки нескольких языков
ОБЗОР #include <locale.h>
ОПИСАНИЕ Локаль — это сочетание языковых и культурных аспектов. Они включают в себя: язык сообщений, различные наборы символов, лексикографические соглашения и т.п. Программа должна определять локализацию и действовать согласно её установкам в целях достижения взаимосвязи различных культур.
Файл <locale.h> описывает типы данных, функции и макросы, необходимые для выполнения этой задачи.
В нём описаны функции: setlocale(3), устанавливающая текущую локаль и localeconv(3), которая возвращает информацию о форматировании чисел.
Существуют различные категории информации в локали, которые программа может использовать; они описаны как макросы. Используя их в качестве первого аргумента функции setlocale(3), можно установить значение значение категории в желаемой локали:
LC_ADDRESS (расширение GNU, начиная с glibc 2.2) Изменяет настройки, которые описывают форматы (например, почтовый адрес), используемые для описания местонахождения и географических объектов. Приложения, в которых требуется эта информация, могут использовать функцию nl_langinfo(3) для получения нестандартных элементов, таких как _NL_ADDRESS_COUNTRY_NAME (название страны на языке локали) и _NL_ADDRESS_LANG_NAME (название языка на языке локали), которая возвращает строку, например «Deutschland» и «Deutsch» (для локалей с немецким языком) (остальные названия элементов перечислены в <langinfo.h>).
LC_COLLATE Эта категория определяет правила сравнения, используемые при сортировке и регулярных выражениях, включая равенство классов символов и сравнение многосимвольных элементов. Эта категория локали изменяет поведение функций strcoll(3) и strxfrm(3), которые используются для сравнения строк с учётом местного алфавита. Например, немецкая эсцет (sharp s) рассматривается как «ss».
LC_CTYPE Эта категория определяет интерпретацию последовательности байт в символы (например, одиночный или многобайтовый символ), классификацию символов (например, буквенный или цифровой) и поведение классов символов. В системах с glibc эта категория также определяет правила транслитерации символов для iconv(1) и iconv(3). Она изменяет поведение функций обработки и классификации символов, таких как isupper(3) и toupper(3), а также многобайтных символьных функций, таких как mblen(3) или wctomb(3).
LC_IDENTIFICATION (расширение GNU, начиная с glibc 2.2) Изменяет настройки, которые относятся к метаданным локали. Приложения, в которых требуется эта информация, могут использовать функцию nl_langinfo(3) для получения нестандартных элементов, таких как _NL_IDENTIFICATION_TITLE (заголовок данной локали) и _NL_IDENTIFICATION_TERRITORY (географическое расположение, для которой создавалась локаль), которая возвращает строку, например «English locale for the USA» и «USA» (остальные названия элементов
LC_MESSAGES Эта категория изменяет язык отображаемых сообщений и указывает, как должны выглядеть положительный и отрицательный ответы. Библиотека GNU C содержит функции gettext(3), ngettext(3) и rpmatch(3) для более удобного использования этой информации. Семейство функций GNU gettext так же учитывает переменную окружения LANGUAGE (содержащую через двоеточие список локалей), если указана допустимая локаль, отличная от "C". Данная категория также влияет на поведение catopen(3).
LC_MEASUREMENT (расширение GNU, начиная с glibc 2.2) Изменяет настройки, которые в локали описывают систему мер (то есть, метрическую систему мер и систему мер США (US customary unit)). Приложения, в которых требуется эта информация, могут использовать функцию nl_langinfo(3) для получения нестандартного элемента _NL_MEASUREMENT_MEASUREMENT, которая возвращает 1 (метрическая) или 2 (система мер США).
LC_NAME (расширение GNU, начиная с glibc 2.2) Изменяет настройки, которые описывают форматы, используемые для описания персон. Приложения, в которых требуется эта информация, могут использовать функцию nl_langinfo(3) для получения нестандартных элементов, таких как _NL_NAME_NAME_MR (приветствие мужчин) и _NL_NAME_NAME_MS (приветствие женщин), которая возвращает строку, например «Herr» и «Frau» (для локалей с немецким языком) (остальные названия элементов перечислены в <langinfo.h>).
LC_NUMERIC Эта категория определяет правила форматирования, используемые для не денежных значений; например, разделительный символ тысяч и дробной части (точка в англоязычных странах, и запятая во многих других). Она влияет на поведение функций printf(3), scanf(3) и strtod(3). Эта информация может быть также прочитана при помощи функции localeconv(3).
LC_PAPER (расширение GNU, начиная с glibc 2.2) Изменяет настройки, которые относятся к размерам стандартных листов бумаги (например, письмо США и A4). Приложения, в которых требуется эта информация, могут использовать функцию nl_langinfo(3) для получения нестандартных элементов, таких как _NL_PAPER_WIDTH и _NL_PAPER_HEIGHT которая возвращает значение int, определяющее размер в миллиметрах.
LC_TELEPHONE (расширение GNU, начиная с glibc 2.2) Изменяет настройки, которые описывают форматы, используемые службах телефонии. Приложения, в которых требуется эта информация, могут использовать функцию nl_langinfo(3) для получения нестандартных элементов, таких как _NL_TELEPHONE_INT_pFIX (международный префикс, используемые для номеров звонков в этой локали), которая возвращает строку, например «49» (для Германии) (остальные названия элементов перечислены в <langinfo.h>).
LC_TIME Эта категория управляет форматированием значений даты и времени. Например, большая часть Европы использует 24-часовой формат, тогда как в США используют 12-часовой.Значение этой категории влияет на поведение функции strftime(3) и strptime(3).
LC_ALL Всё вышеперечисленное.
Если второй аргумент функции setlocale(3) равен пустой строке "", то локаль по умолчанию будет определяться следующим образом:
Информация о локальном форматировании чисел доступна в структуре struct lconv, возвращаемой функцией localeconv(3) , которая описана следующим образом:
struct lconv {
/* Информация о числах (не связанная с деньгами) */
char *decimal_point; /* Символ разделителя дробной части */ char *thousands_sep; /* Разделитель групп цифр слева от символа разделителя дробной части */ char *grouping; /* Каждый элемент является номером цифры в группе; элементы c большими номерами находятся левее. Элемент с значением CHAR_MAX означает, что группировка завершена. Элемент со значением 0 указывает, что предыдущий элемент используется для всех групп, находящихся левее. */
/* В оставшихся полях указывается информация о денежных величинах */
char *int_curr_symbol; /* Первые три символа являются символом валюты, согласно ISO 4217. Четвёртый символ является разделителем. Пятый символ равен '\0'. */ char *currency_symbol; /* Местный символ валюты */ char *mon_decimal_point; /* Символ разделителя дробной части */ char *mon_thousands_sep; /* Как thousands_sep */ char *mon_grouping; /* Как grouping */ char *positive_sign; /* Знак положительных значений */ char *negative_sign; /* Знак отрицательных значений */ char int_frac_digits; /* Представление дробных чисел в международном формате */ char frac_digits; /* Представление дробных чисел в локальном формате */ char p_cs_precedes; /* 1, если символ валюты указывается перед положительным значение, 0 — если следует за ним. */ char p_sep_by_space; /* 1, если пробел отделяет символ валюты от положительного значения */ char n_cs_precedes; /* 1, если символ валюты предшествует отрицательному значению, 0, если следует за ним */ char n_sep_by_space; /* 1, если пробел отделяет символ валюты от отрицательного значения */ /* Позиция положительного или отрицательного знака: 0 Скобки окружают количество и символ валюты. 1 Знак предшествует количеству и символу валюты. 2 Знак следует за количеством и символом валюты. 3 Знак непосредственно предшествует символу валюты. 4 Знак непосредственно следует за символом валюты. */ char p_sign_posn; char n_sign_posn; };
Расширения POSIX.1-2008 программного интерфейса локали В POSIX.1-2008 стандартизовано несколько расширений программного интерфейса локали позволяют указать объект локали, который будет использован при работе функции.
ОКРУЖЕНИЕ Следующая переменная окружения используется в newlocale(3) и setlocale(3), и поэтому влияет на все не привилегированные локализованные программы:
LOCPATH Список путей, разделённых двоеточием («:»), который должен использоваться при поиске данных локали. Если переменная установлена, то используются только скомпилированные файлы данных одной локали из LOCPATH и путь к данным системной локали по умолчанию; все другие доступные архивы локалей не используются (смотрите localedef(1)). Скопированные файлы данных одной локали ищутся в подкаталогах, которые зависят от используемой локали в данный момент. Например, если для категории используется en_GB.UTF-8, то будут просмотрены следующие подкаталоги в таком порядке: en_GB.UTF-8, en_GB.utf8, en_GB, en.UTF-8, en.utf8 и en.
ФАЙЛЫ /usr/lib/locale/locale-archive Обычный путь по умолчанию для расположения архива локалей.
/usr/lib/locale Обычный путь по умолчанию для скомпонованных файлов отдельных локалей.
СООТВЕТСТВИЕ СТАНДАРТАМ POSIX.1-2001.
СМОТРИТЕ ТАКЖЕ iconv(1), locale(1), localedef(1), catopen(3), gettext(3), iconv(3), localeconv(3), mbstowcs(3), newlocale(3), ngettext(3), nl_langinfo(3), rpmatch(3), setlocale(3), strcoll(3), strfmon(3), strftime(3), strxfrm(3), uselocale(3), wcstombs(3), locale(5), charsets(7), unicode(7), utf-8(7)
|