Convertitore Unicode

Avvio rapido

1

Inserisci testo o emoji, poi fai clic su Codifica.

2

Inserisci U+, 0x, \u semplice o token decimali, poi fai clic su Decodifica.

3

Separa più token con spazi, virgole, punto e virgola o nuove righe.

4

Controlla il risultato nello stesso editor, poi copialo.

Scenari comuni

Sviluppo

gestisci le codifiche dei caratteri e analizza problemi di stringhe

Analisi dati

individua caratteri speciali e codifiche in file di testo

Testo del protocollo

esamina il testo del payload incollato come punti di codice e rappresentazioni UTF-8/UTF-16 senza decodificare i byte del pacchetto

Formazione

studia le basi dell'informatica e i principi di codifica dei caratteri

Revisione della sicurezza

controllo a campione di larghezza zero, selettore di variazione, ZWJ o punti di codice di controllo senza un rapporto completo confondibile/bidi

Conversione del formato

passa dal testo leggibile ai token del punto di codice

Parametri e formati di conversione

Punti di codice standard: U+1F600, U+0041

Token \u semplice:\u4E2D,\u0041. Si tratta di un'analisi di token, non di un parser di stringhe letterali JavaScript.

Decimale: 128512, 65

Esadecimale: 0x1F600, 0x0041

Separatori: spazi, virgole, punto e virgola o nuove righe. I token semplici sono decimali; aggiungi U+, 0x o \u per esadecimale.

Confini dei punti di codice

Encode restituisce sempre un elenco di punti di codice U+. I valori decimali, i byte UTF-8, le unità UTF-16 e le coppie surrogate vengono visualizzati nei dettagli, non come formati di output alternativi.

La decodifica accetta token U+, 0x, \u semplici e decimali. Non tratta il semplice esadecimale come 1F600 come esadecimale.

L'analisi token semplice \u non è un parser di stringhe JavaScript: \u{1F600}, \U0001F600, \xNN, escape CSS, entità HTML e codifica percentuale URL sono esterni a questo strumento.

I dettagli dei personaggi mostrano i primi 100 punti di codice univoci con il conteggio delle occorrenze. Le lunghe sequenze di emoji e i segni di combinazione vengono esaminati come punti di codice, non come cluster di grafemi.

Le etichette di blocco, categoria ed emoji sono suggerimenti locali leggeri. La pagina non è un nome, versione, script, bidi o database di normalizzazione ufficiale Unicode.

È possibile effettuare controlli a campione di larghezza zero, variazione, controllo o punti di codice insoliti, ma questo non è uno scanner confondibile, bidi, Trojan Source, IDN o copertura dei caratteri.

La conversione dei punti di codice Unicode viene eseguita localmente nel browser. Il testo sorgente può restare come bozza del browser. Se è attiva un'area di lavoro salvata o la sincronizzazione WebDAV, quel testo può essere salvato anche tramite quella sincronizzazione. Encode, Decode e il testo copiato usano tutti lo stesso contenuto dell'editor; i dettagli dei caratteri vengono ricalcolati da quel contenuto e non vengono salvati come stato di risultato separato. Questo strumento non carica file, non crea allegati e non esporta file.

Consigli d'uso

Input testo: digita o incolla direttamente il contenuto da convertire

Specifiche delle emoji: alcune emoji sono composte da più punti di codice (base + modificatori + selettore di variazione + ZWJ)

Consapevolezza dei surrogati: i caratteri oltre BMP(> U+FFFF) vengono visualizzati come coppie di surrogati UTF‑16 nelle stringhe JavaScript

Limitazioni e compatibilità

Intervallo non valido: i valori <0 o >0x10FFFF vengono rifiutati. I punti di codice surrogati solitari potrebbero essere visualizzati in modo incoerente tra i browser.

Rendering: la visualizzazione varia in base alla piattaforma/carattere

Le etichette di blocco e categoria sono suggerimenti locali leggeri, non un database Unicode completo con nomi ufficiali, script o dati bidi.

Privacy e sicurezza

La conversione dei punti di codice Unicode viene eseguita localmente nel browser. Il testo sorgente può restare come bozza del browser. Se è attiva un'area di lavoro salvata o la sincronizzazione WebDAV, quel testo può essere salvato anche tramite quella sincronizzazione. Encode, Decode e il testo copiato usano tutti lo stesso contenuto dell'editor; i dettagli dei caratteri vengono ricalcolati da quel contenuto e non vengono salvati come stato di risultato separato. Questo strumento non carica file, non crea allegati e non esporta file.

Avvio rapido

Scenari comuni

Sviluppo

Analisi dati

Testo del protocollo

Formazione

Revisione della sicurezza

Conversione del formato

Parametri e formati di conversione

Confini dei punti di codice

Consigli d'uso

Limitazioni e compatibilità

Privacy e sicurezza

Domande frequenti

Perché un singolo carattere può occupare due o più unità UTF‑16?

Perché alcune emoji sono composte da più punti di codice?

Posso mescolare esadecimale e decimale?

Supporta JavaScript \u{1F600} o escape CSS?

Perché blocchi o categorie differiscono dai database Unicode?

È un convertitore di byte UTF-8 o UTF-16?

In cosa differisce da ASCII?

Avvio rapido

Scenari comuni

Sviluppo

Analisi dati

Testo del protocollo

Formazione

Revisione della sicurezza

Conversione del formato

Parametri e formati di conversione

Confini dei punti di codice

Consigli d'uso

Limitazioni e compatibilità

Privacy e sicurezza

Domande frequenti

Perché un singolo carattere può occupare due o più unità UTF‑16?

Perché alcune emoji sono composte da più punti di codice?

Posso mescolare esadecimale e decimale?

Supporta JavaScript \u{1F600} o escape CSS?

Perché blocchi o categorie differiscono dai database Unicode?

È un convertitore di byte UTF-8 o UTF-16?

In cosa differisce da ASCII?

Strumenti correlati