Conversor Unicode
Converta texto e emoji em pontos de código Unicode, decodifique tokens U+, 0x, \u simples ou decimais e veja localmente bytes UTF-8, unidades UTF-16 e pares substitutos.
Texto de entrada
Caracteres
0 / 50,000
Início rápido
Cenários comuns
Programação
lidar com codificações e depurar problemas de strings
Análise de dados
inspecionar caracteres especiais/codificações em textos
Texto do protocolo
inspeciona o texto da carga útil colado como pontos de código e representações UTF-8/UTF-16 sem decodificar bytes de pacote
Educação
aprender fundamentos de codificação de caracteres
Revisão de segurança
verificação pontual de largura zero, seletor de variação, ZWJ ou pontos de código de controle sem um relatório confuso/bidi completo
Conversão de formato
alterne entre texto legível e tokens de ponto de código
Parâmetros de conversão e formatos
Limites de ponto de código
Dicas de uso
Limitações e compatibilidade
Privacidade e segurança
Perguntas frequentes
Porque o ponto de código está fora do BMP (> U+FFFF); o UTF‑16 usa um par substituto (alto/baixo)
Alguns emojis são sequências compostas (base + modificador + seletor de variação + ZWJ). Esta ferramenta mostra seus pontos de código, mas não valida clusters de grafemas ou padrões de emoji.
Sim. U+, 0x, simples \u e tokens decimais podem ser misturados. Use prefixos para valores hexadecimais; tokens não prefixados são tratados como decimais.
Não. Decode analisa apenas U+, 0x, tokens \u simples e tokens decimais. Escapes com chaves em JavaScript, escapes CSS, entidades HTML e percent encoding de URL pertencem a outras ferramentas.
Os cartões de detalhe usam intervalos locais leves e heurísticas. Eles não incluem nomes Unicode oficiais, versões, scripts, classes bidi ou dados de normalização.
Não. Ele mostra bytes UTF-8 e unidades UTF-16 dos caracteres inspecionados, mas não decodifica fluxos de bytes colados, ordem de bytes ou outros conjuntos de caracteres.
ASCII cobre 0–127; Unicode abrange escritas e símbolos até U+10FFFF