Unicode 変換

文字と Unicode コードポイントを相互変換。絵文字対応・文字の詳細情報も表示

使用方法

🚀 かんたんスタート

  • 文字 → コードポイント:文字を入力し「エンコード」をクリック(例:U+0041 U+1F600)
  • コードポイント → 文字:U+ / 0x / 10 進 / \u の形式で入力し「デコード」をクリック(複合絵文字にも対応)
  • 一括処理:複数の文字/コードポイントをまとめて変換
  • 方向切替:「エンコード/デコード」ボタンで選択

📌 よくある利用シーン

  • プログラミング:エンコーディングを扱い、文字列の問題をデバッグ
  • データ分析:テキスト内の特殊文字やエンコーディングを調査
  • ネットワーク:パケット中の 16 進フィールドの解析/検証・双方向性
  • 学習:文字コードの基礎を学ぶ
  • セキュリティ:ゼロ幅や ZWJ など不可視文字の検出
  • 形式変換:異なるエンコーディング間の変換

🎛️ 変換パラメータと形式

  • コードポイント:U+4E2D、U+0041
  • エスケープ:\u4E2D、\u0041
  • 10 進数:20013、65
  • 16 進数:0x4E2D、0x0041
  • 区切り:空白・カンマ・セミコロン

🧭 使い方のヒント

  • テキスト入力:入力または貼り付け
  • Emoji の特性:一部の絵文字は複数のコードポイントで構成(基底+バリエーションセレクタ+ZWJ)
  • サロゲートの意識:BMP を超える文字は UTF‑16 のサロゲートペアで表現

⚠️ 制限事項と互換性

  • 無効な範囲:0 未満や 0x10FFFF を超える値は不可
  • 表示:プラットフォーム/フォントにより表示が異なる場合があります
  • ブロック:一部の歴史的ブロックは環境によって表示できない場合があります

🔒 プライバシーとセキュリティ

  • すべての処理はブラウザ内で完結し、データはお使いのデバイスから外部に送信されません

❓ よくある質問

1 文字が 2 つ以上の UTF‑16 単位になるのはなぜ?

BMP 以外(> U+FFFF)の文字は UTF‑16 でサロゲートペア(上位/下位)になるためです

一部の絵文字が複数のコードポイントから成るのはなぜ?

基底 + バリアント + ZWJ を組み合わせた複合シーケンスのためです

16 進と 10 進を混在できますか?

はい。U+ / 0x / \u / 10 進を自動判別し、空白/カンマ/セミコロンで区切れます

ASCII とどう違いますか?

ASCII は 0–127、Unicode は U+10FFFF まで世界の文字・記号を対象とします

Unicode 変換 - 文字 ↔ コードポイント - CrateX.app