Convertisseur Unicode

Démarrage rapide

1

Saisissez du texte ou un emoji, puis cliquez sur Encoder.

2

Saisissez U+, 0x, \u simple ou des jetons décimaux, puis cliquez sur Décoder.

3

Séparez plusieurs jetons par espaces, virgules, points-virgules ou retours ligne.

4

Vérifiez le résultat dans le même éditeur, puis copiez-le.

Scénarios courants

Programmation

gérer les encodages et déboguer les chaînes

Analyse de données

examiner les caractères spéciaux/encodages

Texte du protocole

inspectez le texte de charge utile collé sous forme de points de code et de représentations UTF-8/UTF-16 sans décoder les octets du paquet.

Apprentissage

comprendre les bases des encodages de caractères

Examen de sécurité

vérification ponctuelle de la largeur nulle, du sélecteur de variation, du ZWJ ou des points de code de contrôle sans rapport complet de confusion/bidi

Conversion de format

basculer entre le texte lisible et les jetons de point de code

Paramètres de conversion et formats

Point de code: U+4E2D, U+0041

Jeton \u simple: \u4E2D, \u0041. Cet outil analyse des jetons, pas des littéraux de chaîne JavaScript.

Décimal: 20013, 65

Hexadécimal: 0x4E2D, 0x0041

Séparateurs: espaces, virgules, points-virgules ou retours à la ligne. Préfixez l’hexadécimal avec U+, 0x ou \u; les nombres sans préfixe sont décimaux.

Limites des points de code

L’encodage produit toujours une liste de points de code U+. Les valeurs décimales, octets UTF-8, unités UTF-16 et paires de substitution apparaissent dans les détails, pas comme formats de sortie alternatifs.

Le décodage accepte U+, 0x, \u simple et les jetons décimaux. Préfixez l’entrée hexadécimale; l’hexadécimal nu comme 1F600 n’est pas un format pris en charge.

L'analyse simple des jetons \u n'est pas un analyseur de chaînes JavaScript: \u{1F600}, \U0001F600, \xNN, les échappements CSS, les entités HTML et le codage en pourcentage URL sont en dehors de cet outil.

Les détails des caractères affichent les 100 premiers points de code uniques avec le nombre d'occurrences. Les longues séquences d'emoji et les marques de combinaison sont inspectées comme des points de code et non comme des groupes de graphèmes.

Les étiquettes de bloc, de catégorie et d’emoji sont des indices locaux légers. La page n'est pas une base de données officielle de nom, de version, de script, de bidi ou de normalisation de Unicode.

Vous pouvez vérifier ponctuellement les points de code de largeur nulle, de variation, de contrôle ou inhabituels, mais il ne s'agit pas d'un scanner prêt à confusion, bidi, source de cheval de Troie, IDN ou de couverture de polices.

La conversion de points de code Unicode s'exécute localement dans le navigateur. Le texte source peut rester comme brouillon du navigateur. Si un espace de travail enregistré ou la synchronisation WebDAV est activé, ce texte peut aussi être enregistré via cette synchronisation. Encode, Decode et le texte copié utilisent tous le contenu du même éditeur ; les détails de caractères sont recalculés depuis ce contenu et ne sont pas enregistrés comme état de résultat séparé. Cet outil n'envoie aucun fichier, ne crée aucune pièce jointe et n'exporte aucun fichier.

Conseils d'utilisation

Saisie: tapez ou collez le contenu

Spécificités des emoji: certains emoji sont composés de plusieurs points de code (base + modificateurs + sélecteur de variation + ZWJ)

Conscience de substitution: les caractères au-delà de BMP(> U+FFFF) apparaissent comme des paires de substitution UTF‑16 dans les chaînes JavaScript

Limitations et compatibilité

Plage non valide: les valeurs <0 ou >0x10FFFF sont rejetées. Les points de code de substitution isolés peuvent s'afficher de manière incohérente dans les navigateurs.

Rendu: l'affichage varie selon la plateforme/police

Les étiquettes de bloc et de catégorie sont des indications locales légères, et non une base de données Unicode complète avec des noms officiels, des scripts ou des données bidi.

Confidentialité & sécurité

La conversion de points de code Unicode s'exécute localement dans le navigateur. Le texte source peut rester comme brouillon du navigateur. Si un espace de travail enregistré ou la synchronisation WebDAV est activé, ce texte peut aussi être enregistré via cette synchronisation. Encode, Decode et le texte copié utilisent tous le contenu du même éditeur ; les détails de caractères sont recalculés depuis ce contenu et ne sont pas enregistrés comme état de résultat séparé. Cet outil n'envoie aucun fichier, ne crée aucune pièce jointe et n'exporte aucun fichier.

Démarrage rapide

Scénarios courants

Programmation

Analyse de données

Texte du protocole

Apprentissage

Examen de sécurité

Conversion de format

Paramètres de conversion et formats

Limites des points de code

Conseils d'utilisation

Limitations et compatibilité

Confidentialité & sécurité

FAQ

Pourquoi un caractère peut‑il avoir deux unités UTF‑16?

Pourquoi certains emoji sont‑ils composés de plusieurs points de code?

Peut‑on mélanger hexadécimal et décimal?

Les échappements JavaScript \u{1F600} ou CSS sont-ils pris en charge?

Pourquoi les blocs ou catégories diffèrent-ils des bases Unicode?

Est-ce un convertisseur d’octets UTF-8 ou UTF-16?

Quelle différence avec ASCII?

Démarrage rapide

Scénarios courants

Programmation

Analyse de données

Texte du protocole

Apprentissage

Examen de sécurité

Conversion de format

Paramètres de conversion et formats

Limites des points de code

Conseils d'utilisation

Limitations et compatibilité

Confidentialité & sécurité

FAQ

Pourquoi un caractère peut‑il avoir deux unités UTF‑16?

Pourquoi certains emoji sont‑ils composés de plusieurs points de code?

Peut‑on mélanger hexadécimal et décimal?

Les échappements JavaScript \u{1F600} ou CSS sont-ils pris en charge?

Pourquoi les blocs ou catégories diffèrent-ils des bases Unicode?

Est-ce un convertisseur d’octets UTF-8 ou UTF-16?

Quelle différence avec ASCII?

Outils associés