Конвертер Unicode

Преобразование символов и кодовых позиций Unicode. Поддержка эмодзи и подробные сведения

Инструкция по использованию

🚀 Быстрый старт

  • Символы → Кодовые позиции: введите текст и нажмите «Кодировать» (напр., U+0041 U+1F600)
  • Кодовые позиции → Символы: введите U+ / 0x / десятичные / \u и нажмите «Декодировать» (включая составные эмодзи)
  • Пакетно: преобразование нескольких символов/кодов сразу
  • Направление: выбирайте кнопками Кодировать/Декодировать

📌 Частые сценарии

  • Программирование: работа с кодировками, отладка строк
  • Аналитика данных: проверка спецсимволов/кодировок в тексте
  • Сети: разбор/проверка шестнадцатеричных полей в пакетах; направленность
  • Обучение: основы кодировок символов
  • Безопасность: выявление невидимых символов (напр., нулевой ширины, ZWJ)
  • Преобразование форматов: между различными системами кодирования

🎛️ Параметры конвертации и форматы

  • Кодовая позиция: U+4E2D, U+0041
  • Escape‑последовательность: \u4E2D, \u0041
  • Десятичный: 20013, 65
  • Шестнадцатеричный: 0x4E2D, 0x0041
  • Разделители: пробелы, запятые или точки с запятой

🧭 Рекомендации по использованию

  • Ввод текста: введите или вставьте
  • Особенности эмодзи: некоторые состоят из нескольких кодовых точек (база + селектор вариации + ZWJ)
  • О суррогатных парах: символы за пределами BMP представлены парами UTF‑16

⚠️ Ограничения и совместимость

  • Недопустимый диапазон: значения <0 или >0x10FFFF отклоняются
  • Отображение: зависит от платформы/шрифта
  • Блоки: некоторые исторические блоки могут не отображаться

🔒 Конфиденциальность и безопасность

  • Вся обработка выполняется в вашем браузере; данные не покидают ваше устройство

❓ Вопросы и ответы

Почему один символ может занимать две единицы UTF‑16?

Потому что его код за пределами BMP (> U+FFFF); для UTF‑16 используется суррогатная пара (старший/младший)

Почему некоторые эмодзи состоят из нескольких кодовых позиций?

Часть эмодзи — это составные последовательности (база + селектор вариации + ZWJ)

Можно смешивать шестнадцатеричный и десятичный?

Да. U+ / 0x / \u / десятичные распознаются автоматически; разделители — пробел/запятая/точка с запятой

Чем отличается от ASCII?

ASCII охватывает 0–127; Unicode включает письменности и символы до U+10FFFF

Преобразование Unicode — символ ↔ кодовая позиция - CrateX.app