本文へスキップ

Unicode正規化

Unicode正規化は、NFC、NFD、NFKC、NFKDへの変換と結合記号の削除をブラウザ内で行います。

1

入力テキスト

正規化、比較、結合記号の削除を行うテキストを貼り付けます。

文字

0 / 500,000

2

正規化形式

出力形式を 1 つ選びます。入力を置き換える前に結果をプレビューします。

NFC · NFC: canonical composition for storage and display

テキストを貼り付けて結果をプレビューする
3

正規化結果

選択した結果をコピーするか、入力へ適用します。

変化なし

選択中の形式: NFC

キャラクター

0 -> 0

UTF-8 バイト

0 -> 0

マークを組み合わせる

0 -> 0

コードポイントの変化

0

元のコードポイント

テキストを貼り付けて結果をプレビューする

結果のコードポイント

テキストを貼り付けて結果をプレビューする

Unicode正規化

クイックスタート

1
テキストを貼り付け
2
NFC、NFD、NFKC、NFKD、または記号削除を選択
3
正規化結果を確認
4
コードポイントとバイト数の変化を確認
5
結果をコピー、または入力へ適用

一般的なシナリオ

Normalize text before storage or comparison

全角整理

NFKCで全角の文字、数字、記号を整理

Remove combining marks for search keys or slugs

Normalize pasted text before diffing or indexing

正規化形式

NFC: canonical composition for storage and display
NFD: canonical decomposition for mark inspection
NFKC: compatibility composition for fullwidth and styled symbols
NFKD: compatibility decomposition before stronger cleanup

使用上のアドバイス

通常の表示用テキストにはNFCを使用
コピーした入力や全角テキストの照合にはNFKCを使用
見た目が変わらないときは、結果のコードポイントとUTF-8バイト数を確認
記号削除は意味を変えることがあります。検索キーやslug向けに使ってください

Unicode 境界線

正規化は暗号化ではなく、機密データを隠すものではありません
これは、混同しやすい、bidi、トロイの木馬ソース、IDN、またはフォント カバレッジ スキャナではありません。
Remove marks deletes combining mark ranges after compatibility decomposition; it is not transliteration
Text may look identical while code points differ
Input limits follow local text tool limits

プライバシーとセキュリティ

すべての処理はブラウザ内でローカルに行われます。現在のテキストは、このデバイス上にローカル セッションの下書きとして保存されます。
Do not paste secrets unless you accept keeping them in this local session draft.

FAQ

6

次の作業に役立つ関連ツールです。

すべてのツール処理はブラウザ内でローカルに行われます。