ADVERTENTIE SLUITEN
Unicode-converter
Unicode-converter
Ondersteunt bidirectionele conversie tussen tekens en Unicode-codepunten, verwerkt emoji, surrogaatparen en meertalige tekst. Detecteert automatisch meerdere formaten (U+, \u, 0x, decimaal), geschikt voor foutopsporing van tekencodering, gegevensanalyse en beveiligingsdetectie.
🚀 Snelstart
- Tekens → codepunten: voer tekst in en klik op "Coderen" om codepunten te zien (zoals U+0041 U+1F600).
- Codepunten → tekens: voer codepunten in (U+/0x/decimaal/\u) en klik op "Decoderen" om leesbare tekst te krijgen (inclusief samengestelde emoji).
- Batch: meerdere tekens of codepunten in één keer converteren.
- Richting: kies via de knoppen Coderen/Decoderen.
📌 Veelvoorkomende scenario's
- Programmeren: omgaan met encodings en stringproblemen debuggen.
- Data-analyse: bijzondere tekens en coderingen in tekstbestanden inspecteren.
- Netwerkcommunicatie: controletekens/richting in protocollen begrijpen en debuggen.
- Onderwijs: basis van computercodering en tekensets leren.
- Security: onzichtbare tekens (zoals zero-width space/ZWJ) opsporen.
- Formaatconversie: tussen verschillende coderingssystemen converteren.
🎛️ Conversieparameters & formaten
- Codepuntnotatie: U+4E2D, U+0041.
- Escape-sequentie: \u4E2D, \u0041.
- Decimaal: 20013, 65.
- Hexadecimaal: 0x4E2D, 0x0041.
- Scheidingstekens: spaties, komma's of puntkomma's.
🧭 Gebruiksadvies
- Tekstinvoer: typ of plak de inhoud.
- Emoji-specifiek: sommige emoji bestaan uit meerdere codepunten (basis + variantselector + ZWJ).
- Surrogatebewustzijn: tekens boven de BMP (> U+FFFF) verschijnen als UTF‑16-surrogateparen.
⚠️ Beperkingen & compatibiliteit
- Ongeldige range: waarden <0 of >0x10FFFF worden geweigerd.
- Weergave: de manier waarop tekens getoond worden, hangt af van platform en font.
- Blokken: enkele historische blokken worden op sommige terminals/browsers niet goed weergegeven.
🔒 Privacy & veiligheid
- Alle verwerking gebeurt in uw browser; gegevens verlaten uw apparaat niet.
❓ Veelgestelde vragen
Waarom wordt één teken soms als twee of meer UTF‑16-units weergegeven?
Omdat het codepunt buiten de BMP valt (> U+FFFF) en UTF‑16 hiervoor een surrogatepaar (hoog/laag) gebruikt.
Waarom bestaan sommige emoji uit meerdere codepunten?
Omdat ze samengestelde sequenties zijn (basis + variantselector + ZWJ‑verbinding).
Kan ik hex en decimaal door elkaar gebruiken?
Ja. U+/0x/\u/decimaal worden automatisch herkend; spaties/komma's/puntkomma's werken als scheidingstekens.
Wat is het verschil met ASCII?
ASCII bestrijkt 0–127; Unicode dekt vrijwel alle scripts en symbolen tot U+10FFFF.