Перейти к содержанию

Нормализация Unicode

Нормализует текст в NFC, NFD, NFKC или NFKD и локально удаляет комбинируемые знаки.

1

Введите текст

Вставьте текст для нормализации, сравнения или удаления меток.

Символы

0 / 500,000

2

Формы нормализации

Выберите один целевой формат. Результат показывается до замены ввода.

NFC · NFC: canonical composition for storage and display

Вставьте текст, чтобы просмотреть результат
3

Нормализованный результат

Скопируйте выбранный результат или примените его обратно к вводу.

Без изменений

Выбранная форма: NFC

Персонажи

0 -> 0

Байты UTF-8

0 -> 0

Объединение знаков

0 -> 0

Изменения кодовых точек

0

Исходные кодовые точки

Вставьте текст, чтобы просмотреть результат

Кодовые точки результата

Вставьте текст, чтобы просмотреть результат

Нормализация Unicode

Быстрый старт

1
Вставьте текст
2
Выберите NFC, NFD, NFKC, NFKD или удаление знаков
3
Проверьте нормализованный результат
4
Проверьте изменения кодовых точек и байтов
5
Скопируйте результат или примените его ко входу

Распространенные сценарии

Normalize text before storage or comparison

Очистка полноширинных символов

используйте NFKC для букв, цифр и символов полной ширины

Remove combining marks for search keys or slugs

Normalize pasted text before diffing or indexing

Формы нормализации

NFC: canonical composition for storage and display
NFD: canonical decomposition for mark inspection
NFKC: compatibility composition for fullwidth and styled symbols
NFKD: compatibility decomposition before stronger cleanup

Рекомендации по использованию

Используйте NFC для обычного отображаемого текста
Используйте NFKC для сопоставления скопированного ввода или полноширинного текста
Если текст выглядит так же, проверьте кодовые точки и байты UTF-8 в результате
Удаление знаков может менять смысл; используйте его для поисковых ключей или slug

Unicode Границы

Нормализация не является шифрованием и не скрывает конфиденциальные данные.
Это не сканер путаницы, биди, троянских источников, IDN или сканера покрытия шрифтов.
Remove marks deletes combining mark ranges after compatibility decomposition; it is not transliteration
Text may look identical while code points differ
Input limits follow local text tool limits

Конфиденциальность и безопасность

Вся обработка происходит локально в вашем браузере. Текущий текст сохраняется на этом устройстве как черновик локального сеанса.
Do not paste secrets unless you accept keeping them in this local session draft.

FAQ

6

Перейдите к следующему шагу с этими связанными инструментами.

Вся обработка инструментов выполняется локально в вашем браузере.