Bộ chuyển đổi Unicode
Chuyển văn bản và emoji thành code point Unicode, giải mã token U+, 0x, \u đơn giản hoặc số thập phân, rồi xem byte UTF-8, đơn vị UTF-16 và surrogate pair ngay trong trình duyệt.
Văn bản đầu vào
Ký tự
0 / 50,000
Bắt đầu nhanh
Tình huống sử dụng phổ biến
Lập trình
xử lý mã hóa và gỡ lỗi chuỗi.
Phân tích dữ liệu
kiểm tra ký tự đặc biệt/mã hóa trong văn bản.
Văn bản giao thức
kiểm tra văn bản tải trọng được dán dưới dạng điểm mã và biểu diễn UTF-8/UTF-16 mà không giải mã byte gói
Giáo dục
học nền tảng về mã hóa ký tự.
Đánh giá bảo mật
kiểm tra tại chỗ độ rộng bằng 0, bộ chọn biến thể, ZWJ hoặc kiểm soát các điểm mã mà không có báo cáo đầy đủ về giá trị có thể nhầm lẫn/giá thầu
Chuyển đổi định dạng
chuyển đổi giữa văn bản có thể đọc được và mã thông báo điểm mã
Tham số & định dạng chuyển đổi
Ranh giới điểm mã
Gợi ý sử dụng
Giới hạn & khả năng tương thích
Quyền riêng tư & bảo mật
Câu hỏi thường gặp
Bởi vì code point của nó nằm ngoài mặt phẳng cơ bản BMP (> U+FFFF), nên UTF‑16 dùng cặp surrogate (high/low).
Một số biểu tượng cảm xúc là chuỗi tổng hợp (cơ sở + công cụ sửa đổi + bộ chọn biến thể + ZWJ). Công cụ này hiển thị các điểm mã của họ nhưng không xác thực các cụm biểu đồ hoặc tiêu chuẩn biểu tượng cảm xúc.
Vâng. Có thể kết hợp các mã thông báo U+, 0x, \u đơn giản và thập phân. Sử dụng tiền tố cho các giá trị thập lục phân; mã thông báo không có tiền tố được coi là số thập phân.
Không. Decode chỉ phân tích U+, 0x, token \u đơn giản và token thập phân. JavaScript brace escape, CSS escape, HTML entity và URL percent encoding thuộc công cụ khác.
Thẻ chi tiết dùng dải cục bộ nhẹ và heuristic. Chúng không chứa tên Unicode chính thức, phiên bản, script, lớp bidi hoặc dữ liệu normalization.
Không. Công cụ chỉ hiển thị byte UTF-8 và đơn vị UTF-16 của ký tự được kiểm tra, không giải mã byte stream, byte order hoặc character set khác được dán vào.
ASCII chỉ bao phủ 0–127; Unicode bao phủ hệ chữ và ký hiệu toàn cầu tới U+10FFFF.