Unicode 规范化
Unicode 规范化在浏览器本地把文本转换为 NFC、NFD、NFKC、NFKD,并可去除组合标记。
1
输入文本
粘贴要规范化、比较或去除标记的文本。
字符
0 / 500,000
2
规范化形式
选择一个输出目标。结果会先预览,不会直接覆盖输入。
NFC · NFC:规范组合,通常适合存储和显示
粘贴文本后预览结果3
规范化结果
复制当前结果,或应用回输入继续处理。
无变化
当前形式: NFC
字符数
0 -> 0
UTF-8 字节
0 -> 0
组合标记
0 -> 0
码点变化
0
原始码点
粘贴文本后预览结果
结果码点
粘贴文本后预览结果
Unicode 规范化粘贴文本选择 NFC、NFD、NFKC、NFKD 或去除标记查看规范化结果检查码点和字节变化复制结果或应用回输入
快速开始
1
2
3
4
5
常见使用场景
文本存储
保存或比较字符串前合并字母和标记
全角清理
用 NFKC 把全角字母、数字和符号转成兼容文本
去除重音
为姓名、slug 或搜索键移除组合标记
粘贴文本
diff、匹配或索引前先规范化复制内容
规范化形式
NFC:规范组合,通常适合存储和显示
NFD:规范分解,适合检查或移除标记
NFKC:兼容组合,会折叠全角和许多样式符号
NFKD:兼容分解,适合更激进清理前使用
使用建议
需要保留重音和符号的正常显示文本时,用 NFC
匹配用户输入、ID 或复制来的全角文本时,用 NFKC
外观看起来没变时,查看结果区的码点和 UTF-8 字节变化
去除标记可能改变某些语言含义;适合搜索键或 slug,不适合作为权威文本
Unicode 边界
规范化不是加密,不能隐藏敏感信息
本工具不是混淆字符、双向控制、Trojan Source、IDN 或字体覆盖扫描器
去除标记会在兼容分解后移除组合标记范围;它不是音译
某些规范化结果看起来一样,但码点可能不同
输入上限遵循本地文本工具限制;超长文档请分段处理
隐私与安全
所有处理都在浏览器本地完成。当前文本会作为本地会话草稿保存在这台设备上。
除非你接受内容保留在本地会话草稿中,否则不要粘贴密钥。
常见问题
普通存储和显示优先用 NFC。它能保持文本紧凑,同时保留常见重音字符。
需要兼容折叠时用 NFKC,例如把全角字母转成普通字母,或把带圈数字转成数字。
不是。它只在分解后移除组合标记,不会转换文字系统或按读音改写词语。
Unicode 形式可能改变码点但不改变渲染外观。请在结果区查看码点和 UTF-8 字节变化。
不能。它只能减少部分兼容差异,不是混淆字符、双向控制或域名仿冒安全扫描器。