Conversor Unicode

Início rápido

1

Insira texto ou emoji e clique em Codificar.

2

Insira U+, 0x, \u simples ou tokens decimais e clique em Decodificar.

3

Separe vários tokens com espaços, vírgulas, ponto e vírgula ou quebras de linha.

4

Confira o resultado no mesmo editor e copie.

Cenários comuns

Programação

lidar com codificações e depurar problemas de strings

Análise de dados

inspecionar caracteres especiais/codificações em textos

Texto do protocolo

inspeciona o texto da carga útil colado como pontos de código e representações UTF-8/UTF-16 sem decodificar bytes de pacote

Educação

aprender fundamentos de codificação de caracteres

Revisão de segurança

verificação pontual de largura zero, seletor de variação, ZWJ ou pontos de código de controle sem um relatório confuso/bidi completo

Conversão de formato

alterne entre texto legível e tokens de ponto de código

Parâmetros de conversão e formatos

Ponto de código: U+4E2D, U+0041

Token simples:\u4E2D,\u0041. Esta é uma análise de token, não um analisador literal de string JavaScript.

Decimal: 20013, 65

Hexadecimal: 0x4E2D, 0x0041

Separadores: espaços, vírgulas, ponto e vírgula ou novas linhas. Os tokens simples são decimais; adicione U+, 0x ou \u para hexadecimal.

Limites de ponto de código

Encode sempre gera uma lista de pontos de código U+. Valores decimais, bytes UTF-8, unidades UTF-16 e pares substitutos são mostrados em detalhes, não como formatos de saída alternativos.

A decodificação aceita tokens U+, 0x, simples \u e decimais. Ele não trata hexadecimal simples como 1F600 como hexadecimal.

A análise de token \u simples não é um analisador de string JavaScript: \u{1F600}, \U0001F600, \xNN, escapes CSS, entidades HTML e codificação percentual URL estão fora desta ferramenta.

Os detalhes dos caracteres mostram os primeiros 100 pontos de código exclusivos com contagens de ocorrências. Longas sequências de emojis e marcas de combinação são inspecionadas como pontos de código, não como agrupamentos de grafemas.

Rótulos de bloco, categoria e emoji são dicas locais leves. A página não é um nome, versão, script, bidi ou banco de dados de normalização Unicode oficial.

Você pode verificar pontos de código de largura zero, variação, controle ou incomuns, mas este não é um scanner confusível, bidi, fonte de Trojan, IDN ou cobertura de fonte.

A conversão de code points Unicode roda localmente no navegador. O texto de origem pode permanecer como rascunho do navegador. Se um espaço de trabalho salvo ou a sincronização WebDAV estiver ativa, esse texto também poderá ser salvo por essa sincronização. Encode, Decode e o texto copiado usam o mesmo conteúdo do editor; os detalhes dos caracteres são recalculados a partir desse conteúdo e não são salvos como um estado de resultado separado. Esta ferramenta não envia arquivos, não cria anexos nem exporta arquivos.

Dicas de uso

Entrada de texto: digite ou cole o conteúdo

Especificidades dos emojis: alguns emojis são compostos de vários pontos de código (base + modificadores + seletor de variação + ZWJ)

Reconhecimento substituto: caracteres além de BMP(> U+FFFF) aparecem como pares substitutos UTF-16 em strings JavaScript

Limitações e compatibilidade

Intervalo inválido: valores <0 ou >0x10FFFF são rejeitados. Pontos de código substitutos solitários podem ser exibidos de forma inconsistente entre navegadores.

Renderização: a exibição varia de acordo com a plataforma/fonte

Os rótulos de bloco e categoria são dicas locais leves, não um banco de dados Unicode completo com nomes oficiais, scripts ou dados bidi.

Privacidade e segurança

A conversão de code points Unicode roda localmente no navegador. O texto de origem pode permanecer como rascunho do navegador. Se um espaço de trabalho salvo ou a sincronização WebDAV estiver ativa, esse texto também poderá ser salvo por essa sincronização. Encode, Decode e o texto copiado usam o mesmo conteúdo do editor; os detalhes dos caracteres são recalculados a partir desse conteúdo e não são salvos como um estado de resultado separado. Esta ferramenta não envia arquivos, não cria anexos nem exporta arquivos.

Início rápido

Cenários comuns

Programação

Análise de dados

Texto do protocolo

Educação

Revisão de segurança

Conversão de formato

Parâmetros de conversão e formatos

Limites de ponto de código

Dicas de uso

Limitações e compatibilidade

Privacidade e segurança

Perguntas frequentes

Por que um caractere pode ter duas unidades UTF‑16?

Por que alguns emoji são compostos por vários pontos de código?

Posso misturar hexadecimal e decimal?

Suporta JavaScript \u{1F600} ou escapes CSS?

Por que blocos ou categorias diferem dos bancos Unicode?

Isto é um conversor de bytes UTF-8 ou UTF-16?

Qual a diferença para ASCII?

Início rápido

Cenários comuns

Programação

Análise de dados

Texto do protocolo

Educação

Revisão de segurança

Conversão de formato

Parâmetros de conversão e formatos

Limites de ponto de código

Dicas de uso

Limitações e compatibilidade

Privacidade e segurança

Perguntas frequentes

Por que um caractere pode ter duas unidades UTF‑16?

Por que alguns emoji são compostos por vários pontos de código?

Posso misturar hexadecimal e decimal?

Suporta JavaScript \u{1F600} ou escapes CSS?

Por que blocos ou categorias diferem dos bancos Unicode?

Isto é um conversor de bytes UTF-8 ou UTF-16?

Qual a diferença para ASCII?

Ferramentas relacionadas