Unicode परिवर्तक
टेक्स्ट और emoji को Unicode कोड पॉइंट में बदलें, U+, 0x, सरल \u या दशमलव token डिकोड करें, और UTF-8 bytes, UTF-16 units तथा surrogate pairs स्थानीय रूप से देखें।
इनपुट टेक्स्ट
अक्षर
0 / 50,000
क्विक स्टार्ट
सामान्य उपयोग के मामले
प्रोग्रामिंग
एन्कोडिंग हैंडल करना और स्ट्रिंग से जुड़ी समस्याओं को डीबग करना।
डेटा विश्लेषण
टेक्स्ट में विशेष कैरेक्टर/एन्कोडिंग की जाँच।
प्रोटोकॉल टेक्स्ट
पैकेट बाइट्स को डिकोड किए बिना कोड बिंदुओं और UTF-8/UTF-16 अभ्यावेदन के रूप में चिपकाए गए पेलोड टेक्स्ट का निरीक्षण करें
शिक्षा
कैरेक्टर एन्कोडिंग की बुनियादी समझ विकसित करना।
सुरक्षा समीक्षा
पूर्ण भ्रमित/बीड़ी रिपोर्ट के बिना शून्य-चौड़ाई, विविधता चयनकर्ता, ZWJ, या नियंत्रण कोड बिंदुओं की स्पॉट-चेक करें
प्रारूप रूपांतरण
पठनीय पाठ और कोड बिंदु टोकन के बीच स्विच करें
रूपांतरण पैरामीटर और फ़ॉर्मैट
कोड बिंदु सीमाएँ
उपयोग टिप्स
सीमाएं और संगतता
गोपनीयता और सुरक्षा
अक्सर पूछे जाने वाले प्रश्न
क्योंकि उसका कोड पॉइंट BMP (U+FFFF) से बड़ा होता है, इसलिए UTF‑16 इसे high/low surrogate pair के रूप में दर्शाता है।
कुछ इमोजी मिश्रित अनुक्रम (आधार + संशोधक + विविधता चयनकर्ता + ZWJ) हैं। यह टूल उनके कोड बिंदु दिखाता है, लेकिन यह ग्रेफेम क्लस्टर या इमोजी मानकों को मान्य नहीं करता है।
हाँ. U+, 0x, सरल \u, और दशमलव टोकन को मिलाया जा सकता है। हेक्साडेसिमल मानों के लिए उपसर्गों का उपयोग करें; उपसर्ग रहित टोकन को दशमलव के रूप में माना जाता है।
नहीं। Decode केवल U+, 0x, सरल \u और decimal tokens पढ़ता है। JavaScript brace escapes, CSS escapes, HTML entities और URL percent encoding अलग टूल के लिए हैं।
Detail cards हल्की local ranges और heuristics इस्तेमाल करते हैं। इनमें official Unicode names, versions, scripts, bidi classes या normalization data शामिल नहीं होते।
नहीं। यह inspected characters के UTF-8 bytes और UTF-16 units दिखाता है, लेकिन pasted byte streams, byte order या दूसरे character sets decode नहीं करता।
ASCII केवल 0–127 तक को कवर करता है; Unicode वैश्विक लिपियों और प्रतीकों को U+10FFFF तक कवर करता है।