Unicode 正規化
Unicode 正規化會在瀏覽器本機把文字轉為 NFC、NFD、NFKC、NFKD,並可移除組合標記。
1
輸入文字
貼上要正規化、比較或移除標記的文字。
字元
0 / 500,000
2
正規化形式
選擇一個輸出目標。結果會先預覽,不會直接覆蓋輸入。
NFC · NFC:正規組合,通常適合儲存和顯示
貼上文字後預覽結果3
正規化結果
複製目前結果,或套用回輸入繼續處理。
無變化
目前形式: NFC
字元數
0 -> 0
UTF-8 位元組
0 -> 0
組合標記
0 -> 0
碼點變化
0
原始碼點
貼上文字後預覽結果
結果碼點
貼上文字後預覽結果
Unicode 正規化貼上文字選擇 NFC、NFD、NFKC、NFKD 或移除標記查看規範化結果檢查碼點和位元組變化複製結果或套用回輸入
快速開始
1
2
3
4
5
常見使用情境
文字儲存
儲存或比較字串前合併字母和標記
全形清理
用 NFKC 把全形字母、數字和符號轉成相容文字
去除重音
為姓名、slug 或搜尋鍵移除組合標記
貼上文字
diff、比對或索引前先正規化複製內容
正規化形式
NFC:正規組合,通常適合儲存和顯示
NFD:正規分解,適合檢查或移除標記
NFKC:相容組合,會折疊全形和許多樣式符號
NFKD:相容分解,適合更激進清理前使用
使用建議
需要保留重音和符號的正常顯示文字時,用 NFC
比對使用者輸入、ID 或複製來的全形文字時,用 NFKC
外觀看起來沒變時,查看結果區的碼點和 UTF-8 位元組變化
移除標記可能改變某些語言含義;適合搜尋鍵或 slug,不適合作為權威文字
Unicode 邊界
正規化不是加密,不能隱藏敏感資訊
本工具不是混淆字元、雙向控制、Trojan Source、IDN 或字型覆蓋掃描器
移除標記會在相容分解後移除組合標記範圍;它不是音譯
某些正規化結果看起來一樣,但碼點可能不同
輸入上限遵循本機文字工具限制;超長文件請分段處理
隱私與安全
所有處理都在瀏覽器本機完成。當前文字會作為本機工作階段草稿保存在這台裝置上。
除非你接受內容保留在本機工作階段草稿中,否則不要貼上密鑰。
常見問題
一般儲存和顯示優先用 NFC。它能保持文字緊湊,同時保留常見重音字元。
需要相容折疊時用 NFKC,例如把全形字母轉成普通字母,或把帶圈數字轉成數字。
不是。它只在分解後移除組合標記,不會轉換文字系統或按讀音改寫詞語。
Unicode 形式可能改變碼點但不改變渲染外觀。請在結果區查看碼點和 UTF-8 位元組變化。
不能。它只能減少部分相容差異,不是混淆字元、雙向控制或網域仿冒安全掃描器。