Bộ chuyển đổi Unicode

Bắt đầu nhanh

1

Nhập văn bản hoặc emoji, rồi bấm Mã hóa.

2

Nhập U+, 0x, \u đơn giản hoặc token thập phân, rồi bấm Giải mã.

3

Tách nhiều token bằng dấu cách, dấu phẩy, dấu chấm phẩy hoặc xuống dòng.

4

Xem kết quả trong cùng trình soạn thảo, rồi sao chép.

Tình huống sử dụng phổ biến

Lập trình

xử lý mã hóa và gỡ lỗi chuỗi.

Phân tích dữ liệu

kiểm tra ký tự đặc biệt/mã hóa trong văn bản.

Văn bản giao thức

kiểm tra văn bản tải trọng được dán dưới dạng điểm mã và biểu diễn UTF-8/UTF-16 mà không giải mã byte gói

Giáo dục

học nền tảng về mã hóa ký tự.

Đánh giá bảo mật

kiểm tra tại chỗ độ rộng bằng 0, bộ chọn biến thể, ZWJ hoặc kiểm soát các điểm mã mà không có báo cáo đầy đủ về giá trị có thể nhầm lẫn/giá thầu

Chuyển đổi định dạng

chuyển đổi giữa văn bản có thể đọc được và mã thông báo điểm mã

Tham số & định dạng chuyển đổi

Mã điểm: U+4E2D, U+0041

Mã thông báo \u đơn giản:\u4E2D,\u0041. Đây là phân tích cú pháp mã thông báo, không phải là trình phân tích cú pháp chuỗi JavaScript.

Thập phân: 20013, 65

Hex: 0x4E2D, 0x0041

Dấu phân cách: dấu cách, dấu phẩy, dấu chấm phẩy hoặc dòng mới. Mã thông báo trần là số thập phân; thêm U+, 0x hoặc \u cho hệ thập lục phân.

Ranh giới điểm mã

Mã hóa luôn xuất ra danh sách điểm mã U+. Các giá trị thập phân, byte UTF-8, đơn vị UTF-16 và các cặp thay thế được hiển thị chi tiết chứ không phải ở dạng định dạng đầu ra thay thế.

Giải mã chấp nhận mã thông báo U+, 0x, \u đơn giản và thập phân. Nó không coi hệ thập lục phân trần như 1F600 là hệ thập lục phân.

Phân tích cú pháp mã thông báo \u đơn giản không phải là trình phân tích cú pháp chuỗi JavaScript: \u{1F600}, \U0001F600, \xNN, CSS thoát, thực thể HTML và mã hóa phần trăm URL nằm ngoài công cụ này.

Chi tiết ký tự hiển thị 100 điểm mã duy nhất đầu tiên cùng với số lần xuất hiện. Chuỗi biểu tượng cảm xúc dài và dấu kết hợp được kiểm tra dưới dạng điểm mã chứ không phải cụm biểu đồ.

Nhãn khối, danh mục và biểu tượng cảm xúc là những gợi ý cục bộ nhẹ. Trang này không phải là tên, phiên bản, tập lệnh, bidi hoặc cơ sở dữ liệu chuẩn hóa chính thức của Unicode.

Bạn có thể kiểm tra tại chỗ các điểm mã có độ rộng bằng 0, biến thể, kiểm soát hoặc bất thường, nhưng đây không phải là trình quét phạm vi phông chữ, bidi, Trojan Source, IDN hoặc phông chữ dễ gây nhầm lẫn.

Việc chuyển đổi Unicode code point chạy cục bộ trong trình duyệt. Văn bản nguồn có thể được giữ như bản nháp của trình duyệt. Nếu không gian làm việc đã lưu hoặc đồng bộ WebDAV được bật, văn bản đó cũng có thể được lưu qua cơ chế đồng bộ đó. Encode, Decode và văn bản đã sao chép đều dùng cùng nội dung trong trình soạn thảo; chi tiết ký tự được tính lại từ nội dung đó và không được lưu như trạng thái kết quả riêng. Công cụ này không tải tệp lên, không tạo tệp đính kèm và không xuất tệp.

Gợi ý sử dụng

Nhập văn bản: gõ hoặc dán nội dung cần xử lý

Thông số cụ thể của biểu tượng cảm xúc: một số biểu tượng cảm xúc bao gồm nhiều điểm mã (cơ sở + công cụ sửa đổi + bộ chọn biến thể + ZWJ)

Nhận thức thay thế: các ký tự ngoài BMP(> U+FFFF) xuất hiện dưới dạng cặp thay thế UTF‑16 trong chuỗi JavaScript

Giới hạn & khả năng tương thích

Phạm vi không hợp lệ: các giá trị <0 hoặc >0x10FFFF bị từ chối. Điểm mã thay thế đơn độc có thể hiển thị không nhất quán trên các trình duyệt.

Kết xuất: hiển thị thay đổi tùy theo nền tảng/phông chữ

Nhãn khối và danh mục là những gợi ý cục bộ nhẹ, không phải là cơ sở dữ liệu Unicode đầy đủ với tên chính thức, tập lệnh hoặc dữ liệu bidi.

Quyền riêng tư & bảo mật

Việc chuyển đổi Unicode code point chạy cục bộ trong trình duyệt. Văn bản nguồn có thể được giữ như bản nháp của trình duyệt. Nếu không gian làm việc đã lưu hoặc đồng bộ WebDAV được bật, văn bản đó cũng có thể được lưu qua cơ chế đồng bộ đó. Encode, Decode và văn bản đã sao chép đều dùng cùng nội dung trong trình soạn thảo; chi tiết ký tự được tính lại từ nội dung đó và không được lưu như trạng thái kết quả riêng. Công cụ này không tải tệp lên, không tạo tệp đính kèm và không xuất tệp.

Bắt đầu nhanh

Tình huống sử dụng phổ biến

Lập trình

Phân tích dữ liệu

Văn bản giao thức

Giáo dục

Đánh giá bảo mật

Chuyển đổi định dạng

Tham số & định dạng chuyển đổi

Ranh giới điểm mã

Gợi ý sử dụng

Giới hạn & khả năng tương thích

Quyền riêng tư & bảo mật

Câu hỏi thường gặp

Vì sao một ký tự lại hiển thị hai hoặc nhiều đơn vị UTF‑16?

Vì sao một số emoji được tạo từ nhiều code point?

Có thể trộn dạng hex và thập phân không?

Có hỗ trợ JavaScript \u{1F600} hoặc CSS escape không?

Vì sao block hoặc category khác cơ sở dữ liệu Unicode?

Đây có phải bộ chuyển đổi byte UTF-8 hoặc UTF-16 không?

Khác gì so với ASCII?

Bắt đầu nhanh

Tình huống sử dụng phổ biến

Lập trình

Phân tích dữ liệu

Văn bản giao thức

Giáo dục

Đánh giá bảo mật

Chuyển đổi định dạng

Tham số & định dạng chuyển đổi

Ranh giới điểm mã

Gợi ý sử dụng

Giới hạn & khả năng tương thích

Quyền riêng tư & bảo mật

Câu hỏi thường gặp

Vì sao một ký tự lại hiển thị hai hoặc nhiều đơn vị UTF‑16?

Vì sao một số emoji được tạo từ nhiều code point?

Có thể trộn dạng hex và thập phân không?

Có hỗ trợ JavaScript \u{1F600} hoặc CSS escape không?

Vì sao block hoặc category khác cơ sở dữ liệu Unicode?

Đây có phải bộ chuyển đổi byte UTF-8 hoặc UTF-16 không?

Khác gì so với ASCII?

Công cụ liên quan