Конвертер Unicode

Быстрый старт

1

Введите текст или emoji и нажмите «Кодировать».

2

Введите U+, 0x, простой \u или десятичные токены и нажмите «Декодировать».

3

Разделяйте несколько токенов пробелами, запятыми, точками с запятой или переносами строк.

4

Проверьте результат в том же редакторе и скопируйте его.

Частые сценарии

Программирование

работа с кодировками, отладка строк

Аналитика данных

проверка спецсимволов/кодировок в тексте

Текст протокола

проверка вставленного текста полезных данных в виде кодовых точек и представлений UTF-8/UTF-16 без декодирования байтов пакета.

Обучение

основы кодировок символов

Проверка безопасности

выборочная проверка нулевой ширины, селектора вариантов, ZWJ или контрольных кодовых точек без полного отчета о путанице/биди.

Преобразование формата

переключение между читаемым текстом и токенами кодовых точек.

Параметры конвертации и форматы

Кодовая позиция: U+4E2D, U+0041

Простой токен \u:\u4E2D,\u0041. Это анализ токена, а не анализатор строковых литералов JavaScript.

Десятичный: 20013, 65

Шестнадцатеричный: 0x4E2D, 0x0041

Разделители: пробелы, запятые, точки с запятой или новые строки. Голые токены являются десятичными; добавьте U+, 0x или \u для шестнадцатеричного числа.

Границы кодовых точек

Encode всегда выводит список кодовых точек U+. Десятичные значения, байты UTF-8, единицы UTF-16 и суррогатные пары показаны подробно, а не как альтернативные форматы вывода.

Декодирование принимает U+, 0x, простые \u и десятичные токены. Он не рассматривает голый шестнадцатеричный код, такой как 1F600, как шестнадцатеричный.

Простой синтаксический анализ токена \u не является анализатором строк JavaScript: \u{1F600}, \U0001F600, \xNN, escape-символы CSS, объекты HTML и процентное кодирование URL находятся за пределами этого инструмента.

В сведениях о символах показаны первые 100 уникальных кодовых точек с количеством вхождений. Длинные последовательности эмодзи и комбинированные знаки проверяются как кодовые точки, а не как кластеры графем.

Ярлыки блоков, категорий и смайлов представляют собой легкие локальные подсказки. Эта страница не является официальным именем, версией, шрифтом, двунаправленным текстом или базой данных нормализации в Юникоде.

Вы можете выборочно проверить нулевую ширину, вариации, контроль или необычные кодовые точки, но это не сканер путаницы, биди, троянских источников, IDN или сканера покрытия шрифтов.

Преобразование кодовых точек Unicode выполняется локально в браузере. Исходный текст может остаться как черновик браузера. Если включена сохраненная рабочая область или синхронизация WebDAV, этот текст также может сохраняться через эту синхронизацию. Encode, Decode и копируемый текст используют одно и то же содержимое редактора; сведения о символах пересчитываются из этого содержимого и не сохраняются как отдельное состояние результата. Этот инструмент не загружает файлы, не создает вложения и не экспортирует файлы.

Ограничения и совместимость

Неверный диапазон: значения <0 или >0x10FFFF отклоняются. Одиночные суррогатные кодовые точки могут отображаться в разных браузерах непоследовательно.

Рендеринг: отображение зависит от платформы/шрифта.

Метки блоков и категорий представляют собой легкие локальные подсказки, а не полную базу данных Unicode с официальными названиями, сценариями или данными двунаправленного текста.

Конфиденциальность и безопасность

Преобразование кодовых точек Unicode выполняется локально в браузере. Исходный текст может остаться как черновик браузера. Если включена сохраненная рабочая область или синхронизация WebDAV, этот текст также может сохраняться через эту синхронизацию. Encode, Decode и копируемый текст используют одно и то же содержимое редактора; сведения о символах пересчитываются из этого содержимого и не сохраняются как отдельное состояние результата. Этот инструмент не загружает файлы, не создает вложения и не экспортирует файлы.

Быстрый старт

Частые сценарии

Программирование

Аналитика данных

Текст протокола

Обучение

Проверка безопасности

Преобразование формата

Параметры конвертации и форматы

Границы кодовых точек

Рекомендации по использованию

Ограничения и совместимость

Конфиденциальность и безопасность

Частые вопросы

Почему один символ может занимать две единицы UTF‑16?

Почему некоторые эмодзи состоят из нескольких кодовых позиций?

Можно смешивать шестнадцатеричный и десятичный?

Поддерживаются ли JavaScript \u{1F600} или CSS escape?

Почему блоки или категории отличаются от баз Unicode?

Это конвертер байтов UTF-8 или UTF-16?

Чем отличается от ASCII?

Быстрый старт

Частые сценарии

Программирование

Аналитика данных

Текст протокола

Обучение

Проверка безопасности

Преобразование формата

Параметры конвертации и форматы

Границы кодовых точек

Рекомендации по использованию

Ограничения и совместимость

Конфиденциальность и безопасность

Частые вопросы

Почему один символ может занимать две единицы UTF‑16?

Почему некоторые эмодзи состоят из нескольких кодовых позиций?

Можно смешивать шестнадцатеричный и десятичный?

Поддерживаются ли JavaScript \u{1F600} или CSS escape?

Почему блоки или категории отличаются от баз Unicode?

Это конвертер байтов UTF-8 или UTF-16?

Чем отличается от ASCII?

Связанные инструменты