Конвертер Unicode
Преобразуйте текст и emoji в кодовые точки Unicode, декодируйте токены U+, 0x, простые \u или десятичные значения и локально смотрите байты UTF-8, кодовые единицы UTF-16 и суррогатные пары.
Исходный текст
Символы
0 / 50,000
Быстрый старт
Частые сценарии
Программирование
работа с кодировками, отладка строк
Аналитика данных
проверка спецсимволов/кодировок в тексте
Текст протокола
проверка вставленного текста полезных данных в виде кодовых точек и представлений UTF-8/UTF-16 без декодирования байтов пакета.
Обучение
основы кодировок символов
Проверка безопасности
выборочная проверка нулевой ширины, селектора вариантов, ZWJ или контрольных кодовых точек без полного отчета о путанице/биди.
Преобразование формата
переключение между читаемым текстом и токенами кодовых точек.
Параметры конвертации и форматы
Границы кодовых точек
Рекомендации по использованию
Ограничения и совместимость
Конфиденциальность и безопасность
Частые вопросы
Потому что его код за пределами BMP (> U+FFFF); для UTF‑16 используется суррогатная пара (старший/младший)
Некоторые смайлы представляют собой составные последовательности (основа + модификатор + селектор вариантов + ZWJ). Этот инструмент показывает их кодовые точки, но не проверяет кластеры графем или стандарты эмодзи.
Да. U+, 0x, простые \u и десятичные токены можно смешивать. Используйте префиксы для шестнадцатеричных значений; токены без префикса рассматриваются как десятичные.
Нет. Decode разбирает только U+, 0x, простые токены \u и десятичные токены. JavaScript brace escapes, CSS escapes, HTML entities и URL percent encoding относятся к другим инструментам.
Карточки деталей используют легкие локальные диапазоны и эвристики. Они не содержат официальные имена Unicode, версии, scripts, bidi classes или данные нормализации.
Нет. Он показывает UTF-8 bytes и UTF-16 code units для проверяемых символов, но не декодирует вставленные byte streams, byte order или другие character sets.
ASCII охватывает 0–127; Unicode включает письменности и символы до U+10FFFF