Unicode-converter
Zet tekst en emoji om naar Unicode-codepoints, decodeer U+, 0x, eenvoudige \u of decimale tokens en bekijk UTF-8-bytes, UTF-16-code units en surrogate pairs lokaal.
Invoertekst
Tekens
0 / 50,000
Snelstart
Veelvoorkomende scenario's
Programmeren
omgaan met encodings en stringproblemen debuggen.
Data-analyse
bijzondere tekens en coderingen in tekstbestanden inspecteren.
Protocoltekst
inspecteer geplakte payload-tekst als codepunten en UTF-8/UTF-16-representaties zonder pakketbytes te decoderen
Onderwijs
basis van computercodering en tekensets leren.
Beveiligingsbeoordeling
controle van nulbreedte, variatiekiezer, ZWJ of controlecodepunten zonder een volledig verwarrend/bidi-rapport
Formaatconversie
schakel tussen leesbare tekst en codepunttokens
Conversieparameters & formaten
Codepuntgrenzen
Gebruiksadvies
Beperkingen & compatibiliteit
Privacy & veiligheid
Veelgestelde vragen
Omdat het codepunt buiten de BMP valt (> U+FFFF) en UTF‑16 hiervoor een surrogatepaar (hoog/laag) gebruikt.
Sommige emoji zijn samengestelde reeksen (basis + modifier + variatiekiezer + ZWJ). Deze tool toont hun codepunten, maar valideert geen grafeemclusters of emoji-standaarden.
Ja. U+, 0x, eenvoudige \u en decimale tokens kunnen worden gemengd. Gebruik voorvoegsels voor hexadecimale waarden; tokens zonder voorvoegsel worden als decimaal behandeld.
Nee. Decode parseert alleen U+, 0x, eenvoudige \u-tokens en decimale tokens. JavaScript brace escapes, CSS-escapes, HTML-entiteiten en URL-percent encoding horen bij andere tools.
De detailkaarten gebruiken lichte lokale bereiken en heuristiek. Ze bevatten geen officiële Unicode-namen, versies, scripts, bidi-klassen of normalisatiegegevens.
Nee. Het toont UTF-8-bytes en UTF-16-code units voor geïnspecteerde tekens, maar decodeert geen geplakte byte streams, byte order of andere tekensets.
ASCII bestrijkt 0–127; Unicode dekt vrijwel alle scripts en symbolen tot U+10FFFF.