跳到主要內容

Unicode 正規化

Unicode 正規化會在瀏覽器本機把文字轉為 NFC、NFD、NFKC、NFKD,並可移除組合標記。

1

輸入文字

貼上要正規化、比較或移除標記的文字。

字元

0 / 500,000

2

正規化形式

選擇一個輸出目標。結果會先預覽,不會直接覆蓋輸入。

NFC · NFC:正規組合,通常適合儲存和顯示

貼上文字後預覽結果
3

正規化結果

複製目前結果,或套用回輸入繼續處理。

無變化

目前形式: NFC

字元數

0 -> 0

UTF-8 位元組

0 -> 0

組合標記

0 -> 0

碼點變化

0

原始碼點

貼上文字後預覽結果

結果碼點

貼上文字後預覽結果

Unicode 正規化

快速開始

1
貼上文字
2
選擇 NFC、NFD、NFKC、NFKD 或移除標記
3
查看規範化結果
4
檢查碼點和位元組變化
5
複製結果或套用回輸入

常見使用情境

文字儲存

儲存或比較字串前合併字母和標記

全形清理

用 NFKC 把全形字母、數字和符號轉成相容文字

去除重音

為姓名、slug 或搜尋鍵移除組合標記

貼上文字

diff、比對或索引前先正規化複製內容

正規化形式

NFC:正規組合,通常適合儲存和顯示
NFD:正規分解,適合檢查或移除標記
NFKC:相容組合,會折疊全形和許多樣式符號
NFKD:相容分解,適合更激進清理前使用

使用建議

需要保留重音和符號的正常顯示文字時,用 NFC
比對使用者輸入、ID 或複製來的全形文字時,用 NFKC
外觀看起來沒變時,查看結果區的碼點和 UTF-8 位元組變化
移除標記可能改變某些語言含義;適合搜尋鍵或 slug,不適合作為權威文字

Unicode 邊界

正規化不是加密,不能隱藏敏感資訊
本工具不是混淆字元、雙向控制、Trojan Source、IDN 或字型覆蓋掃描器
移除標記會在相容分解後移除組合標記範圍;它不是音譯
某些正規化結果看起來一樣,但碼點可能不同
輸入上限遵循本機文字工具限制;超長文件請分段處理

隱私與安全

所有處理都在瀏覽器本機完成。當前文字會作為本機工作階段草稿保存在這台裝置上。
除非你接受內容保留在本機工作階段草稿中,否則不要貼上密鑰。

常見問題

6

可繼續使用這些相關工具,完成後續步驟。

所有工具處理都在您的瀏覽器本地完成。