Unicode 转换
Unicode 转换可将文本和 emoji 转为 Unicode 码点,或解码带前缀的十六进制和十进制 token,并在本地展示 UTF-8 字节、UTF-16 单元和代理对。
输入文本
字符
0 / 50,000
Unicode 转换输入文本或 emoji,然后点击“编码”。输入 U+、0x、简单 \u 或十进制 token,然后点击“解码”。多个 token 可用空格、逗号、分号或换行分隔。查看同一编辑器中的结果,然后复制。
快速开始
1
2
3
4
常见使用场景
程序开发
处理字符编码、调试字符串问题
数据分析
分析文本文件中的特殊字符和编码
协议文本
把粘贴的 payload 文本按码点和 UTF-8/UTF-16 表示检查,不解码 packet bytes。
教育学习
学习计算机基础、理解字符编码原理
安全排查
点查零宽字符、变体选择器、ZWJ 或控制码点,不输出完整 confusable/bidi 报告
格式转换
在可读文本与码点 token 之间切换
转换参数与格式
标准码点:U+1F600、U+0041
简单 \u token:\u4E2D、\u0041。本工具解析 token,不是 JavaScript 字符串 literal 解析器。
十进制:128512、65
十六进制:0x1F600、0x0041
分隔符:空格、逗号、分号和换行均可混用。十六进制请加 U+、0x 或 \u;无前缀数字按十进制处理。
码点转换边界
编码固定输出 U+ 码点列表。十进制、UTF-8 字节、UTF-16 单元和代理对显示在详情卡中,不是可切换输出格式。
解码支持 U+、0x、简单 \u 和十进制 token。十六进制输入请加前缀;1F600 这类无前缀裸十六进制不是受支持输入格式。
简单 \u token 解析不是 JavaScript 字符串解析器:\u{1F600}、\U0001F600、\xNN、CSS escape、HTML 实体和 URL 百分号编码都不属于本工具。
字符详情只显示前 100 个唯一码点并统计出现次数。长 emoji 序列和组合音标按码点检查,不按 grapheme cluster 校验。
区块、类别和 emoji 标签是本地轻量提示。本页不是官方 Unicode 名称、版本、脚本、bidi 或规范化数据库。
可以点查零宽、变体、控制或异常码点,但不是 confusable、bidi、Trojan Source、IDN 或字体覆盖扫描器。
Unicode 码点转换在浏览器本地完成。源文本可能作为浏览器草稿保留。若启用已保存工作区或 WebDAV 同步,该文本也可能随同步保存。Encode、Decode 和复制文本都使用同一个编辑器内容;字符详情会由该内容重新计算,不会保存为单独结果状态。本工具不会上传文件、创建附件或导出文件。
使用建议
文本输入:直接输入或粘贴需要转换的文本内容
Emoji 特性:部分 emoji 由多码点组成(基底 + 修饰符 + 变体选择器 + ZWJ)
代理对意识:超出 BMP(> U+FFFF)的字符在 JavaScript 字符串中会呈现为 UTF-16 代理对
限制与兼容性
非法范围:<0 或 >0x10FFFF 的值会报错;孤立 surrogate 码点在不同浏览器中可能显示不稳定。
呈现差异:不同平台和字体的显示效果可能不同
区块与类别标签是本地轻量提示,不是包含官方名称、脚本、bidi 数据的完整 Unicode 数据库。
隐私与安全
Unicode 码点转换在浏览器本地完成。源文本可能作为浏览器草稿保留。若启用已保存工作区或 WebDAV 同步,该文本也可能随同步保存。Encode、Decode 和复制文本都使用同一个编辑器内容;字符详情会由该内容重新计算,不会保存为单独结果状态。本工具不会上传文件、创建附件或导出文件。
常见问题
因为该字符码点超出 BMP(> U+FFFF),需要用代理对(High/Low Surrogates)表示
部分 emoji 是组合序列(基底 + 修饰符 + 变体选择器 + ZWJ)。本工具展示其码点组成,但不校验 grapheme cluster 或 emoji 标准。
可以,U+、0x、简单 \u 与十进制 token 可以混用。十六进制值请加前缀;无前缀 token 会按十进制处理。
不支持。解码只解析 U+、0x、简单 \u 和十进制 token;JavaScript 大括号 escape、CSS escape、HTML 实体和 URL 百分号编码属于其它工具。
详情卡使用本地轻量范围和启发式标签,不包含官方 Unicode 名称、版本、脚本、bidi 类别或规范化数据。
不是。本工具只在详情卡展示字符的 UTF-8 字节和 UTF-16 单元,不解码粘贴的字节流、字节序或其它字符集。
ASCII 仅覆盖 0–127,Unicode 覆盖全球文字与符号,范围至 U+10FFFF