Unicode 変換
テキストや絵文字を Unicode コードポイントに変換し、接頭辞付き 16 進数や 10 進数トークンをデコードして、UTF-8 バイト、UTF-16 単位、サロゲートペアをローカルで確認できます。
入力テキスト
文字
0 / 50,000
かんたんスタート
よくある利用シーン
プログラミング
エンコーディングを扱い、文字列の問題をデバッグ
データ分析
テキスト内の特殊文字やエンコーディングを調査
プロトコル テキスト
パケット バイトをデコードせずに、貼り付けられたペイロード テキストをコード ポイントおよび UTF-8/UTF-16 表現として検査します。
学習
文字コードの基礎を学ぶ
セキュリティ確認
ゼロ幅、異体字セレクタ、ZWJ、制御コードポイントを点検できますが、confusable や bidi の完全なレポートは出しません。
フォーマット変換
可読テキストとコードポイントトークンを切り替えます。
変換パラメータと形式
コードポイントの境界
使い方のヒント
制限事項と互換性
プライバシーとセキュリティ
よくある質問
BMP 以外(> U+FFFF)の文字は UTF‑16 でサロゲートペア(上位/下位)になるためです
一部の絵文字は複合シーケンス (ベース + 修飾子 + バリエーション セレクター + ZWJ) です。このツールはコード ポイントを表示しますが、書記素クラスターや絵文字標準は検証しません。
はい。 U+、0x、単純な \u、および 10 進数のトークンは混合できます。 16 進値には接頭辞を使用します。接頭辞のないトークンは 10 進数として扱われます。
対応していません。デコードできるのは U+、0x、単純な \u、10 進数トークンだけです。JavaScript の波括弧エスケープ、CSS エスケープ、HTML エンティティ、URL パーセントエンコードは別の用途です。
詳細カードはローカルの軽量な範囲表と推定ラベルを使います。公式の Unicode 名、バージョン、スクリプト、bidi クラス、正規化データは含みません。
いいえ。詳細カードに UTF-8 バイトと UTF-16 単位を表示しますが、貼り付けたバイト列、バイト順、他の文字セットはデコードしません。
ASCII は 0–127、Unicode は U+10FFFF まで世界の文字・記号を対象とします