Unicode 変換

かんたんスタート

1

テキストまたは絵文字を入力し、エンコードをクリックします。

2

U+、0x、単純な \u、または 10 進数トークンを入力し、デコードをクリックします。

3

複数トークンはスペース、カンマ、セミコロン、改行で区切ります。

4

同じエディターの結果を確認してコピーします。

よくある利用シーン

プログラミング

エンコーディングを扱い、文字列の問題をデバッグ

データ分析

テキスト内の特殊文字やエンコーディングを調査

プロトコルテキスト

パケットバイトをデコードせずに、貼り付けられたペイロードテキストをコードポイントおよび UTF-8/UTF-16 表現として検査します。

学習

文字コードの基礎を学ぶ

セキュリティ確認

ゼロ幅、異体字セレクタ、ZWJ、制御コードポイントを点検できますが、confusable や bidi の完全なレポートは出しません。

フォーマット変換

可読テキストとコードポイントトークンを切り替えます。

変換パラメータと形式

コードポイント：U+4E2D、U+0041

単純な \u トークン: \u4E2D、\u0041。これはトークン解析であり、JavaScript 文字列リテラルの解析ではありません。

10 進数：20013、65

16 進数：0x4E2D、0x0041

区切り: スペース、カンマ、セミコロン、改行。16 進数には U+、0x、または \u を付けます。接頭辞のない数字は 10 進数です。

コードポイントの境界

Encode は常に U+ コードポイントリストを出力します。 10 進数値、UTF-8 バイト、UTF-16 単位、およびサロゲートペアは、代替出力形式としてではなく、詳細に示されています。

デコードは U+、0x、単純な \u、10 進数トークンを受け付けます。16 進数には接頭辞を付けてください。1F600 のような接頭辞なしの裸の 16 進数は対応形式ではありません。

単純な \u トークン解析は JavaScript 文字列パーサーではありません: \u{1F600}、\U0001F600、\xNN、CSS エスケープ、HTML エンティティ、および URL パーセントエンコーディングはこのツールの範囲外です。

文字の詳細には、最初の 100 個の一意のコードポイントと出現回数が表示されます。長い絵文字シーケンスと結合マークは、書記素クラスターではなくコードポイントとして検査されます。

ブロック、カテゴリ、絵文字のラベルは、軽量のローカルヒントです。このページは、公式の Unicode 名、バージョン、スクリプト、BIDI、または正規化データベースではありません。

ゼロ幅、バリエーション、制御、または異常なコードポイントをスポットチェックできますが、これは混同しやすい、bidi、トロイの木馬ソース、IDN、またはフォントカバレッジスキャナーではありません。

Unicode コードポイント変換はブラウザ内でローカルに実行されます。元のテキストはブラウザの下書きとして残ることがあります。保存済みワークスペースまたは WebDAV 同期が有効な場合、そのテキストも同期経由で保存されることがあります。Encode、Decode、コピーするテキストはいずれも同じエディター内容を使用します。文字詳細はその内容から再計算され、別の結果状態として保存されません。このツールはファイルをアップロードせず、添付ファイルを作成せず、ファイルを書き出しません。

使い方のヒント

テキスト入力：入力または貼り付け

絵文字の詳細: 一部の絵文字は複数のコードポイント (ベース + 修飾子 + バリエーションセレクター + ZWJ) で構成されています。

サロゲートの認識: BMP(> U+FFFF) を超える文字は、JavaScript 文字列内の UTF‑16 サロゲートペアとして表示されます。

制限事項と互換性

無効な範囲: 値 <0 または >0x10FFFF は拒否されます。単独のサロゲートコードポイントは、ブラウザ間で一貫性なく表示される場合があります。

レンダリング: 表示はプラットフォーム/フォントによって異なります

ブロックラベルとカテゴリラベルは軽量のローカルヒントであり、正式名、スクリプト、または Bidi データを含む完全な Unicode データベースではありません。

プライバシーとセキュリティ

Unicode コードポイント変換はブラウザ内でローカルに実行されます。元のテキストはブラウザの下書きとして残ることがあります。保存済みワークスペースまたは WebDAV 同期が有効な場合、そのテキストも同期経由で保存されることがあります。Encode、Decode、コピーするテキストはいずれも同じエディター内容を使用します。文字詳細はその内容から再計算され、別の結果状態として保存されません。このツールはファイルをアップロードせず、添付ファイルを作成せず、ファイルを書き出しません。

かんたんスタート

よくある利用シーン

プログラミング

データ分析

プロトコルテキスト

学習

セキュリティ確認

フォーマット変換

変換パラメータと形式

コードポイントの境界

使い方のヒント

制限事項と互換性

プライバシーとセキュリティ

よくある質問

1 文字が 2 つ以上の UTF‑16 単位になるのはなぜ？

一部の絵文字が複数のコードポイントから成るのはなぜ？

16 進と 10 進を混在できますか？

JavaScript の \u{1F600} や CSS エスケープに対応していますか?

ブロックやカテゴリが Unicode データベースと違うのはなぜですか?

UTF-8 や UTF-16 のバイト変換ツールですか?

ASCII とどう違いますか？

かんたんスタート

よくある利用シーン

プログラミング

データ分析

プロトコル テキスト

学習

セキュリティ確認

フォーマット変換

変換パラメータと形式

コードポイントの境界

使い方のヒント

制限事項と互換性

プライバシーとセキュリティ

よくある質問

1 文字が 2 つ以上の UTF‑16 単位になるのはなぜ？

一部の絵文字が複数のコードポイントから成るのはなぜ？

16 進と 10 進を混在できますか？

JavaScript の \u{1F600} や CSS エスケープに対応していますか?

ブロックやカテゴリが Unicode データベースと違うのはなぜですか?

UTF-8 や UTF-16 のバイト変換ツールですか?

ASCII とどう違いますか？

関連ツール

プロトコルテキスト