Convertisseur Unicode
Convertissez du texte et des emoji en points de code Unicode, décodez les jetons hexadécimaux préfixés ou décimaux, puis inspectez localement les octets UTF-8, les unités UTF-16 et les paires de substitution.
Texte d’entrée
Caractères
0 / 50,000
Démarrage rapide
Scénarios courants
Programmation
gérer les encodages et déboguer les chaînes
Analyse de données
examiner les caractères spéciaux/encodages
Texte du protocole
inspectez le texte de charge utile collé sous forme de points de code et de représentations UTF-8/UTF-16 sans décoder les octets du paquet.
Apprentissage
comprendre les bases des encodages de caractères
Examen de sécurité
vérification ponctuelle de la largeur nulle, du sélecteur de variation, du ZWJ ou des points de code de contrôle sans rapport complet de confusion/bidi
Conversion de format
basculer entre le texte lisible et les jetons de point de code
Paramètres de conversion et formats
Limites des points de code
Conseils d'utilisation
Limitations et compatibilité
Confidentialité & sécurité
FAQ
Car son point de code est hors BMP (> U+FFFF); UTF‑16 utilise alors une paire de substitution (haut/bas)
Certains emoji sont des séquences composites (base + modificateur + sélecteur de variation + ZWJ). Cet outil affiche leurs points de code, mais il ne valide pas les clusters de graphèmes ni les normes emoji.
Oui. Les jetons U+, 0x, simple \u et décimal peuvent être mélangés. Utilisez des préfixes pour les valeurs hexadécimales; les jetons sans préfixe sont traités comme décimaux.
Non. Le décodage analyse seulement U+, 0x, \u simple et les jetons décimaux. Les échappements JavaScript avec accolades, CSS, entités HTML et encodage URL relèvent d’autres outils.
Les cartes de détail utilisent des plages locales légères et des heuristiques. Elles ne contiennent pas les noms Unicode officiels, versions, scripts, classes bidi ou données de normalisation.
Non. Il affiche les octets UTF-8 et les unités UTF-16 des caractères inspectés, mais ne décode pas les flux d’octets collés, l’ordre des octets ni d’autres jeux de caractères.
ASCII couvre 0–127; Unicode couvre les écritures et symboles jusqu’à U+10FFFF