跳到主内容

Unicode 规范化

Unicode 规范化在浏览器本地把文本转换为 NFC、NFD、NFKC、NFKD,并可去除组合标记。

1

输入文本

粘贴要规范化、比较或去除标记的文本。

字符

0 / 500,000

2

规范化形式

选择一个输出目标。结果会先预览,不会直接覆盖输入。

NFC · NFC:规范组合,通常适合存储和显示

粘贴文本后预览结果
3

规范化结果

复制当前结果,或应用回输入继续处理。

无变化

当前形式: NFC

字符数

0 -> 0

UTF-8 字节

0 -> 0

组合标记

0 -> 0

码点变化

0

原始码点

粘贴文本后预览结果

结果码点

粘贴文本后预览结果

Unicode 规范化

快速开始

1
粘贴文本
2
选择 NFC、NFD、NFKC、NFKD 或去除标记
3
查看规范化结果
4
检查码点和字节变化
5
复制结果或应用回输入

常见使用场景

文本存储

保存或比较字符串前合并字母和标记

全角清理

用 NFKC 把全角字母、数字和符号转成兼容文本

去除重音

为姓名、slug 或搜索键移除组合标记

粘贴文本

diff、匹配或索引前先规范化复制内容

规范化形式

NFC:规范组合,通常适合存储和显示
NFD:规范分解,适合检查或移除标记
NFKC:兼容组合,会折叠全角和许多样式符号
NFKD:兼容分解,适合更激进清理前使用

使用建议

需要保留重音和符号的正常显示文本时,用 NFC
匹配用户输入、ID 或复制来的全角文本时,用 NFKC
外观看起来没变时,查看结果区的码点和 UTF-8 字节变化
去除标记可能改变某些语言含义;适合搜索键或 slug,不适合作为权威文本

Unicode 边界

规范化不是加密,不能隐藏敏感信息
本工具不是混淆字符、双向控制、Trojan Source、IDN 或字体覆盖扫描器
去除标记会在兼容分解后移除组合标记范围;它不是音译
某些规范化结果看起来一样,但码点可能不同
输入上限遵循本地文本工具限制;超长文档请分段处理

隐私与安全

所有处理都在浏览器本地完成。当前文本会作为本地会话草稿保存在这台设备上。
除非你接受内容保留在本地会话草稿中,否则不要粘贴密钥。

常见问题

6

可继续使用这些相关工具,完成后续步骤。

所有工具处理都在您的浏览器本地完成。