Convertitore Unicode
Converti testo ed emoji in code point Unicode, decodifica token U+, 0x, \u semplici o decimali e visualizza in locale byte UTF-8, unità UTF-16 e coppie surrogate.
Testo in ingresso
Caratteri
0 / 50,000
Avvio rapido
Scenari comuni
Sviluppo
gestisci le codifiche dei caratteri e analizza problemi di stringhe
Analisi dati
individua caratteri speciali e codifiche in file di testo
Testo del protocollo
esamina il testo del payload incollato come punti di codice e rappresentazioni UTF-8/UTF-16 senza decodificare i byte del pacchetto
Formazione
studia le basi dell'informatica e i principi di codifica dei caratteri
Revisione della sicurezza
controllo a campione di larghezza zero, selettore di variazione, ZWJ o punti di codice di controllo senza un rapporto completo confondibile/bidi
Conversione del formato
passa dal testo leggibile ai token del punto di codice
Parametri e formati di conversione
Confini dei punti di codice
Consigli d'uso
Limitazioni e compatibilità
Privacy e sicurezza
Domande frequenti
Perché il suo punto di codice è oltre il BMP (> U+FFFF), quindi in UTF‑16 è rappresentato da una coppia surrogate (high/low)
Alcune emoji sono sequenze composte (base + modificatore + selettore di variazione + ZWJ). Questo strumento mostra i loro punti di codice, ma non convalida i cluster di grafemi o gli standard di emoji.
Sì. I token U+, 0x, \u semplici e decimali possono essere mischiati. Utilizzare i prefissi per i valori esadecimali; i token senza prefisso vengono trattati come decimali.
No. Decode analizza solo U+, 0x, token \u semplici e token decimali. JavaScript brace escape, escape CSS, entità HTML e percent encoding URL appartengono ad altri strumenti.
Le schede dettaglio usano intervalli locali leggeri ed euristiche. Non includono nomi Unicode ufficiali, versioni, script, classi bidi o dati di normalizzazione.
No. Mostra byte UTF-8 e unità UTF-16 per i caratteri ispezionati, ma non decodifica byte stream incollati, byte order o altri set di caratteri.
ASCII copre solo 0–127; Unicode copre scritture e simboli di tutto il mondo fino a U+10FFFF