Перейти к содержанию
Конвертер времени начала матчей ЧМ уже доступенСмотрите время начала в своем часовом поясе и добавляйте напоминания в календарь.

Конвертер Unicode

Преобразуйте текст и emoji в кодовые точки Unicode, декодируйте токены U+, 0x, простые \u или десятичные значения и локально смотрите байты UTF-8, кодовые единицы UTF-16 и суррогатные пары.

Исходный текст

Символы

0 / 50,000

Конвертер Unicode

Быстрый старт

1
Введите текст или emoji и нажмите «Кодировать».
2
Введите U+, 0x, простой \u или десятичные токены и нажмите «Декодировать».
3
Разделяйте несколько токенов пробелами, запятыми, точками с запятой или переносами строк.
4
Проверьте результат в том же редакторе и скопируйте его.

Частые сценарии

Программирование

работа с кодировками, отладка строк

Аналитика данных

проверка спецсимволов/кодировок в тексте

Текст протокола

проверка вставленного текста полезных данных в виде кодовых точек и представлений UTF-8/UTF-16 без декодирования байтов пакета.

Обучение

основы кодировок символов

Проверка безопасности

выборочная проверка нулевой ширины, селектора вариантов, ZWJ или контрольных кодовых точек без полного отчета о путанице/биди.

Преобразование формата

переключение между читаемым текстом и токенами кодовых точек.

Параметры конвертации и форматы

Кодовая позиция: U+4E2D, U+0041
Простой токен \u:\u4E2D,\u0041. Это анализ токена, а не анализатор строковых литералов JavaScript.
Десятичный: 20013, 65
Шестнадцатеричный: 0x4E2D, 0x0041
Разделители: пробелы, запятые, точки с запятой или новые строки. Голые токены являются десятичными; добавьте U+, 0x или \u для шестнадцатеричного числа.

Границы кодовых точек

Encode всегда выводит список кодовых точек U+. Десятичные значения, байты UTF-8, единицы UTF-16 и суррогатные пары показаны подробно, а не как альтернативные форматы вывода.
Декодирование принимает U+, 0x, простые \u и десятичные токены. Он не рассматривает голый шестнадцатеричный код, такой как 1F600, как шестнадцатеричный.
Простой синтаксический анализ токена \u не является анализатором строк JavaScript: \u{1F600}, \U0001F600, \xNN, escape-символы CSS, объекты HTML и процентное кодирование URL находятся за пределами этого инструмента.
В сведениях о символах показаны первые 100 уникальных кодовых точек с количеством вхождений. Длинные последовательности эмодзи и комбинированные знаки проверяются как кодовые точки, а не как кластеры графем.
Ярлыки блоков, категорий и смайлов представляют собой легкие локальные подсказки. Эта страница не является официальным именем, версией, шрифтом, двунаправленным текстом или базой данных нормализации в Юникоде.
Вы можете выборочно проверить нулевую ширину, вариации, контроль или необычные кодовые точки, но это не сканер путаницы, биди, троянских источников, IDN или сканера покрытия шрифтов.
Преобразование кодовых точек Unicode выполняется локально в браузере. Исходный текст может остаться как черновик браузера. Если включена сохраненная рабочая область или синхронизация WebDAV, этот текст также может сохраняться через эту синхронизацию. Encode, Decode и копируемый текст используют одно и то же содержимое редактора; сведения о символах пересчитываются из этого содержимого и не сохраняются как отдельное состояние результата. Этот инструмент не загружает файлы, не создает вложения и не экспортирует файлы.

Рекомендации по использованию

Ввод текста: введите или вставьте
Особенности эмодзи: некоторые эмодзи состоят из нескольких кодовых точек (база + модификаторы + селектор вариантов + ZWJ).
Поддержка суррогатных функций: символы за пределами BMP(> U+FFFF) отображаются как суррогатные пары UTF-16 в строках JavaScript.

Ограничения и совместимость

Неверный диапазон: значения <0 или >0x10FFFF отклоняются. Одиночные суррогатные кодовые точки могут отображаться в разных браузерах непоследовательно.
Рендеринг: отображение зависит от платформы/шрифта.
Метки блоков и категорий представляют собой легкие локальные подсказки, а не полную базу данных Unicode с официальными названиями, сценариями или данными двунаправленного текста.

Конфиденциальность и безопасность

Преобразование кодовых точек Unicode выполняется локально в браузере. Исходный текст может остаться как черновик браузера. Если включена сохраненная рабочая область или синхронизация WebDAV, этот текст также может сохраняться через эту синхронизацию. Encode, Decode и копируемый текст используют одно и то же содержимое редактора; сведения о символах пересчитываются из этого содержимого и не сохраняются как отдельное состояние результата. Этот инструмент не загружает файлы, не создает вложения и не экспортирует файлы.

Частые вопросы

6

Перейдите к следующему шагу с этими связанными инструментами.

Ресурсы

Руководства

Вся обработка инструментов выполняется локально в вашем браузере.