Дополнение Latin-1 (блок Unicode) - Latin-1 Supplement (Unicode block)

Элементы управления C1 и приложение Latin-1
КлассифицироватьU + 0080..U + 00FF
(128 кодовых точек)
СамолетBMP
Скриптылатинский (64 символа)
Общий (64 символа)
Основные алфавитыФранцузский
Немецкий
исландский
испанский
Наборы символовПунктуация
Математика
Валюта
Назначенный128 кодовых точек
33 Управление или форматирование
Неиспользованный0 зарезервированных кодовых точек
Исходные стандартыИСО / МЭК 8859-1
История версий Unicode
1.0.0128 (+128)
Примечание: [1][2]

В Дополнение Latin-1 (также называемый Элементы управления C1 и приложение Latin-1) является вторым Блок Unicode в Unicode стандарт. Он кодирует верхний диапазон ISO 8859-1: 80 (U + 0080) - FF (U + 00FF). Органы управления C1 (0080–009F) не являются графическими. Этот блок имеет диапазон от U + 0080 до U + 00FF, содержит 128 символов и включает C1 контролирует, Latin-1 пунктуация и символы, 30 пар маюскула и крошечный акцентированный Латинские символы и 2 математических оператора.

Элементы управления C1 и дополнительный блок Latin-1 были включены в его нынешнюю форму с тем же набором символов, что и в версии 1.0. Стандарт Юникода.[3] Его имя блока в Unicode 1.0 было просто Latin1.[4]

Таблица символов

КодРезультатОписаниеАкроним
C1 Элементы управления
U + 0080Заполнение символаPAD
U + 0081Предустановка старшего октетаПРЫГАТЬ
U + 0082Здесь разрешен перерывАденома простаты
U + 0083Здесь нет перерываNBH
U + 0084ИндексIND
U + 0085Следующая строкаNEL
U + 0086Начало выбранной областиSSA
U + 0087Конец выделенной областиЕКА
U + 0088Набор символьных (горизонтальных) таблицHTS
U + 0089Таблица знаков (горизонтальная) с обоснованиемHTJ
U + 008AНабор линейных (вертикальных) таблицLTS
U + 008BНеполная линия вперед (вниз)PLD
U + 008CЧастичная линия назад (вверх)PLU
U + 008DОбратный перевод строки (Индекс)RI
U + 008EВ одну смену дваSS2
U + 008FВ одну смену триSS3
U + 0090Строка управления устройствомDCS
U + 0091Частное использование одинPU1
U + 0092Частное использование дваPU2
U + 0093Установить состояние передачиСТС
U + 0094Отменить символCCH
U + 0095Ожидающее сообщениеМВт
U + 0096Начало охраняемой территорииСПА
U + 0097Конец охраняемой территорииEPA
U + 0098Начало строкиSOS
U + 0099Представитель одного графического персонажаSGCI
U + 009AПредставитель одного персонажаSCI
U + 009BВведение в контрольную последовательностьCSI
U + 009CСтрока терминатораST
U + 009DКоманда операционной системыOSC
U + 009EПриватное сообщениеВЕЧЕРА
U + 009FКоманда прикладной программыAPC
Знаки препинания и символы Latin-1
U + 00A0 Неразрывное пространствоNBSP
U + 00A1¡Перевернутый восклицательный знак
U + 00A2¢Знак цента
U + 00A3£Знак фунта стерлингов
U + 00A4¤Знак валюты
U + 00A5¥Знак иены
U + 00A6¦Сломанный бар
U + 00A7§Знак раздела
U + 00A8¨Диэрезис
U + 00A9©Знак авторского права
U + 00AAªЖенский порядковый показатель
U + 00AB«Двойные угловые кавычки, указывающие влево
U + 00AC¬Не подписывать
U + 00ADМягкий дефисЗАСТЕНЧИВЫЙ
U + 00AE®Зарегистрированный знак
U + 00AF¯Макрон
U + 00B0°Символ степени
U + 00B1±Знак плюс-минус
U + 00B2²Верхний индекс два
U + 00B3³Верхний индекс три
U + 00B4´Острый акцент
U + 00B5µМикро знак
U + 00B6Pilcrow знак
U + 00B7·Средняя точка
U + 00B8¸Седиль
U + 00B9¹Надстрочный один
U + 00BAºИндикатор мужского рода
U + 00BB»Двойные угловые кавычки, указывающие вправо
U + 00BC¼Вульгарная фракция одна четверть
U + 00BD½Вульгарная фракция одна половина
U + 00BE¾Вульгарная фракция три четверти
U + 00BF¿Перевернутый вопросительный знак
Буквы
U + 00C0АЛатинская заглавная буква А с тупым ударением
U + 00C1ÁЛатинская заглавная буква А с острым ударением
U + 00C2ÂЛатинская заглавная буква A с циркумфлексом
U + 00C3ÃЛатинская заглавная буква А с тильдой
U + 00C4ÄЛатинская заглавная буква А с тремой
U + 00C5ÅЛатинская заглавная буква А с кольцом сверху
U + 00C6ÆЛатинская заглавная буква AE
U + 00C7ÇЛатинская заглавная буква C с седилем
U + 00C8ÈЛатинская заглавная буква E с тупым ударением
U + 00C9ÉЛатинская заглавная буква E с острым ударением
U + 00CAÊЛатинская заглавная буква E с циркумфлексом
U + 00CBËЛатинская заглавная буква E с тремой
U + 00CCЯЛатинская заглавная буква I с тупым ударением
U + 00CDЯЛатинская заглавная буква I с острым ударением
U + 00CEЯЛатинская заглавная буква I с циркумфлексом
U + 00CFЯЛатинская заглавная буква I с тремой
U + 00D0ÐЛатинская заглавная буква Eth
U + 00D1ÑЛатинская заглавная буква N с тильдой
U + 00D2ÒЛатинская заглавная буква O с тупым ударением
U + 00D3ÓЛатинская заглавная буква O с острым ударением
U + 00D4ÔЛатинская заглавная буква O с циркумфлексом
U + 00D5ÕЛатинская заглавная буква O с тильдой
U + 00D6ÖЛатинская заглавная буква O с тремой
Математический оператор
U + 00D7×Знак умножения
Буквы
U + 00D8ØЛатинская заглавная буква O со штрихом
U + 00D9ÙЛатинская заглавная буква U с тупым ударением
U + 00DAÚЛатинская заглавная буква U с острым ударением
U + 00DBÛЛатинская заглавная буква U с циркумфлексом
U + 00DCÜЛатинская заглавная буква U с тремой
U + 00DDÝЛатинская заглавная буква Y с острым ударением
U + 00DEÞЛатинская заглавная буква шип
U + 00DFSSЛатинская строчная буква острый S
U + 00E0àЛатинская строчная буква A с тупым ударением
U + 00E1áЛатинская строчная буква А с острым ударением
U + 00E2âЛатинская строчная буква A с циркумфлексом
U + 00E3ãЛатинская строчная буква A с тильдой
U + 00E4äЛатинская строчная буква А с тремой
U + 00E5åЛатинская строчная буква A с кольцом сверху
U + 00E6æЛатинская строчная буква AE
U + 00E7çЛатинская строчная буква C с седилем
U + 00E8èЛатинская строчная буква E с тупым ударением
U + 00E9éЛатинская строчная буква E с острым ударением
U + 00EAêЛатинская строчная буква E с циркумфлексом
U + 00EBëЛатинская строчная буква E с тремой
U + 00ECяЛатинская строчная буква I с тупым ударением
U + 00EDяЛатинская строчная буква I с острым ударением
U + 00EEяЛатинская строчная буква I с циркумфлексом
U + 00EFяЛатинская строчная буква I с тремой
U + 00F0ðЛатинская строчная буква Eth
U + 00F1ñЛатинская строчная буква N с тильдой
U + 00F2òЛатинская строчная буква O с тупым ударением
U + 00F3óЛатинская строчная буква O с острым ударением
U + 00F4ôЛатинская строчная буква O с циркумфлексом
U + 00F5хЛатинская строчная буква O с тильдой
U + 00F6öЛатинская строчная буква O с тремой
Математический оператор
U + 00F7÷Знак деления
Буквы
U + 00F8øЛатинская строчная буква O со штрихом
U + 00F9ùЛатинская строчная буква U с тупым ударением
U + 00FAúЛатинская строчная буква U с острым ударением
U + 00FBûЛатинская строчная буква U с циркумфлексом
U + 00FCüЛатинская строчная буква U с тремой
U + 00FDýЛатинская строчная буква Y с острым ударением
U + 00FEþЛатинская строчная буква шип
U + 00FFÿЛатинская строчная буква Y с тремой

Подзаголовки

Блок C1 Controls и Latin-1 Supplement имеет четыре подзаголовка в своем наборе символов: элементы управления C1, Пунктуация и символы Latin-1, буквы и математический оператор (ы).[5]

C1 контролирует

Подзаголовок управления C1 содержит 32 дополнительных управляющих кода, унаследованных от ИСО / МЭК 8859-1 и многие другие стандарты 8-битных символов. Псевдонимы для управляющих кодов C0 и C1 взяты из ИСО / МЭК 6429: 1992.[5]

Знаки препинания и символы Latin-1

Подзаголовок «Пунктуация и символы Latin-1» содержит 32 символа общих международных знаков препинания, таких как перевернутые восклицательные и вопросительные знаки, а также среднюю точку; и символы, такие как знаки валюты, диакритические знаки через интервалы, вульгарная дробь и числа в верхнем индексе.[5]

Буквы

Подзаголовок «Буквы» содержит 30 пар больших и малых акцентированных или новых латинских символов для западноевропейских языков, а также два дополнительных миниатюрных символа, которые обычно не используются в словах изначально.[5]

Математический оператор

Подзаголовок «Математический оператор» используется для знаков умножения и деления.[5]

Количество символов, букв и контрольных кодов

В таблице ниже показано количество каждой буквы, символа и контрольного кода в каждом подзаголовке в блоке C1 Controls и Latin-1 Supplement.

Тип подзаголовкаКоличество символовДиапазон персонажей
C1 контролирует32 управляющих кодаU + 0080 - U + 009F
Знаки препинания и символы Latin-132 знаков препинания и символовU + 00A0 - U + 00BF
Буквы30 пар маюскула и крошечный акцентированный Латинские символыОт U + 00C0 до U + 00D6, от U + 00D8 до U + 00F6 и от U + 00F8 до U + 00FF
Математические операторыВ U + 00D7 × ЗНАК УМНОЖЕНИЯ и U + 00F7 ÷ ЗНАК ДЕЛЕНИЯ символы.U + 00D7 и U + 00F7

Компактный стол

Элементы управления C1 и приложение Latin-1[1]
Таблица кодов официального консорциума Unicode (PDF)
 0123456789АBCDEF
U + 008x XXX XXX Аденома простаты NBH IND NEL SSA ЕКА HTS HTJ СУДС PLD PLU RI SS2 SS3
U + 009x DCS PU1 PU2 СТС CCH МВт СПА EPA SOS XXX SCI CSI ST OSC ВЕЧЕРА APC
U + 00AxNB
SP
¡¢£¤¥¦§¨©ª«¬ ЗАСТЕНЧИВЫЙ
­
®¯
U + 00Bx°±²³´µ·¸¹º»¼½¾¿
U + 00CxАÁÂÃÄÅÆÇÈÉÊËЯЯЯЯ
U + 00DxÐÑÒÓÔÕÖ×ØÙÚÛÜÝÞSS
U + 00Exàáâãäåæçèéêëяяяя
U + 00Fxðñòóôхö÷øùúûüýþÿ
Примечания
1.^ Начиная с версии Unicode 13.0

Эмодзи

Блок Latin-1 Supplement содержит два смайлики: U + 00A9 и U + 00AE.[6][7]

В блоке четыре стандартизованные варианты определены для указания стиля эмодзи (U + FE0F VS16) или текстового представления (U + FE0E VS15) для двух эмодзи, оба из которых по умолчанию представляют собой текстовое представление.[8]

Последовательности вариаций эмодзи
U +00A900AE
базовая кодовая точка©®
база + VS15 (текст)©︎®︎
база + VS16 (смайлики)©️®️

История

Следующие документы, относящиеся к Unicode, фиксируют цель и процесс определения определенных символов в блоке дополнения Latin-1:

ВерсияОкончательный код[а]СчитатьL2 Я БЫWG2 Я БЫДокумент
1.0.0U + 0080..009F32X3L2 / 95-002PDAM № 3 по ISO / IEC 10646-1 по кодированию элементов управления C1, 1994-11-01
X3L2 / 95-028N1148Девять таблиц ответов на повторное / расширенное голосование, 1995-02-22
N1203Umamaheswaran, V. S .; Ксар, Майк (1995-05-03), "5,3", Неподтвержденный протокол заседания 27 SC2 / WG2, Женева
X3L2 / 95-061DAM № 3 по ISO / IEC 10646-1 (Кодирование элементов управления C1), 1995-06-01
N1307Таблица ответов на бюллетень JTC1 на 10646 DAM 3, Кодирование элементов управления C1, (SC2 N 2666), 1996-01-15
N1309Патерсон, Брюс (1996-01-17), Отчет и удаление комментариев к DAM 1, UTF 16 и DAM 2, UTF-8, DAM 3, кодирование элементов управления C1 и DAM 4, удаление приложения G: UTF1
N1312Патерсон, Брюс (1996-01-17), Проект окончательного текста 10646 AMD-3, Кодирование элементов управления C1
L2 / 99-048Умамахесваран, В. С. (4 февраля 1999 г.), Элементы управления C1 в кодовых таблицах
L2 / 99-054RАлипранд, Джоан (1999-06-21), "C1 Controls", Утвержденный протокол встречи UTC / L2 в Пало-Альто 3-5 февраля 1999 г.
N3046Suignard, Мишель (22 февраля 2006 г.), Улучшение формального определения управляющих символов
N3103 (pdf, док )Умамахесваран В. С. (25 августа 2006 г.), "M48.33", Неподтвержденный протокол заседания РГ 2 48, Маунтин-Вью, Калифорния, США; 2006-04-24 / 27
U + 00A0..00FF96(быть определенным)
X3L2 / 94-077N994Дэвис, Марк (1994-03-03), ISO / IEC 10646-1 - Предлагаемый проект исправления 1
X3L2 / 94-098N1033 (pdf, док )Umamaheswaran, V. S .; Ксар, Майк (1994-06-01), "8.1.15", Неподтвержденный протокол заседания 25 ISO / IEC JTC 1 / SC 2 / WG 2, отель Falez, Анталия, Турция, 18 апреля 1994 г.
L2 / 11-016Мур, Лиза (2011-02-15), «Исправьте ошибки в присвоении свойств для букв верхнего и нижнего индекса (B.13.4) [U + 00AA, U + 00BA]», UTC # 126 / L2 # 223 Минуты
L2 / 11-116Мур, Лиза (2011-05-17), «Консенсус 127-C14», UTC # 127 / L2 # 224 минуты, Измените общую категорию на U + 00AA FEMININE ORDINAL INDICATOR и U + 00BA MASCULINE ORDINAL INDICATOR "Lo" для Unicode 6.1.
L2 / 11-261R2Мур, Лиза (2011-08-16), «Консенсус 128-C6», UTC # 128 / L2 # 225 минут, Измените общую категорию с "So" на "Po" ... [U + 00A7 и U + 00B6]
L2 / 15-050R[b][c]Дэвис, Марк; и другие. (2015-01-29), Дополнительные селекторы вариантов для эмодзи
  1. ^ Предлагаемые кодовые точки и имена символов могут отличаться от окончательных кодовых точек и имен.
  2. ^ Смотрите также L2 / 13-207, L2 / 14-054, L2 / 14-063, L2 / 15-051A, L2 / 15-051B
  3. ^ Обратитесь к раздел истории блока Разные символы и пиктограммы для дополнительных документов, связанных с эмодзи.

Смотрите также

Рекомендации

  1. ^ «База данных символов Юникода». Стандарт Юникода. Получено 2016-07-09.
  2. ^ «Нумерованные версии стандарта Unicode». Стандарт Юникода. Получено 2016-07-09.
  3. ^ Стандартная версия Unicode 1.0, том 1. Эддисон-Уэсли Паблишинг Компани, Инк. 1991 [1990]. ISBN  0-201-56788-1.
  4. ^ «3.8: Блок-за-блок-схемы» (PDF). Стандарт Юникода. версия 1.0. Консорциум Unicode.
  5. ^ а б c d е «Кодовые таблицы Unicode 6.2» (PDF). Стандарт Юникода. Получено 1 апреля 2013.
  6. ^ "UTR # 51: Unicode Emoji". Консорциум Unicode. 2020-02-11.
  7. ^ "UCD: данные эмодзи для UTR №51". Консорциум Unicode. 2020-01-28.
  8. ^ "Последовательности вариаций эмодзи UTS # 51". Консорциум Unicode.