ĐÓNG QUẢNG CÁO
Bộ chuyển đổi Unicode
Bộ chuyển đổi Unicode
Hỗ trợ chuyển đổi hai chiều giữa ký tự và điểm mã Unicode, xử lý emoji, cặp thay thế và văn bản đa ngôn ngữ. Tự động phát hiện nhiều định dạng (U+, \u, 0x, thập phân), phù hợp cho gỡ lỗi mã hóa ký tự, phân tích dữ liệu và phát hiện bảo mật.
🚀 Bắt đầu nhanh
- Ký tự → Code point: nhập văn bản, sau đó nhấn "Mã hóa" để xem danh sách code point (ví dụ U+0041 U+1F600).
- Code point → Ký tự: nhập code point (U+ / 0x / thập phân / \u) rồi nhấn "Giải mã" để nhận văn bản dễ đọc (bao gồm emoji tổ hợp).
- Xử lý hàng loạt: chuyển đổi nhiều ký tự hoặc nhiều mã cùng lúc.
- Chiều chuyển đổi: chọn bằng các nút Mã hóa/Giải mã.
📌 Tình huống sử dụng phổ biến
- Lập trình: xử lý mã hóa và gỡ lỗi chuỗi.
- Phân tích dữ liệu: kiểm tra ký tự đặc biệt/mã hóa trong văn bản.
- Mạng: parse/kiểm tra trường hex trong gói tin, hướng ký tự.
- Giáo dục: học nền tảng về mã hóa ký tự.
- Bảo mật: phát hiện ký tự vô hình (ví dụ zero‑width, ZWJ).
- Chuyển đổi định dạng: chuyển giữa các dạng biểu diễn mã khác nhau.
🎛️ Tham số & định dạng chuyển đổi
- Code point: U+4E2D, U+0041
- Chuỗi escape: \u4E2D, \u0041
- Thập phân: 20013, 65
- Hex: 0x4E2D, 0x0041
- Dấu phân cách: khoảng trắng, dấu phẩy hoặc chấm phẩy
🧭 Gợi ý sử dụng
- Nhập văn bản: gõ hoặc dán nội dung cần xử lý
- Lưu ý emoji: một số emoji được ghép từ nhiều code point (ký tự gốc + variation selector + ZWJ).
- Nhận thức surrogate: ký tự ngoài BMP (> U+FFFF) trong UTF‑16 sẽ xuất hiện dưới dạng cặp surrogate.
⚠️ Giới hạn & khả năng tương thích
- Giới hạn phạm vi: giá trị <0 hoặc >0x10FFFF sẽ bị từ chối.
- Hiển thị: cách render ký tự phụ thuộc nền tảng/font.
- Block: một số block lịch sử có thể không hiển thị trên một số terminal/trình duyệt.
🔒 Quyền riêng tư & bảo mật
- Toàn bộ xử lý diễn ra trong trình duyệt; dữ liệu của bạn không rời khỏi thiết bị.
❓ Câu hỏi thường gặp
Vì sao một ký tự lại hiển thị hai hoặc nhiều đơn vị UTF‑16?
Bởi vì code point của nó nằm ngoài mặt phẳng cơ bản BMP (> U+FFFF), nên UTF‑16 dùng cặp surrogate (high/low).
Vì sao một số emoji được tạo từ nhiều code point?
Một số emoji là chuỗi tổ hợp (ký tự gốc + variation selector + ZWJ).
Có thể trộn dạng hex và thập phân không?
Có. U+ / 0x / \u / thập phân đều được tự nhận dạng; khoảng trắng/dấu phẩy/chấm phẩy là dấu phân cách hợp lệ.
Khác gì so với ASCII?
ASCII chỉ bao phủ 0–127; Unicode bao phủ hệ chữ và ký hiệu toàn cầu tới U+10FFFF.