ADVERTENTIE SLUITEN

Unicode-converter

Unicode-converter

Ondersteunt bidirectionele conversie tussen tekens en Unicode-codepunten, verwerkt emoji, surrogaatparen en meertalige tekst. Detecteert automatisch meerdere formaten (U+, \u, 0x, decimaal), geschikt voor foutopsporing van tekencodering, gegevensanalyse en beveiligingsdetectie.

Gebruiksinstructies

🚀 Snelstart

  • Tekens → codepunten: voer tekst in en klik op "Coderen" om codepunten te zien (zoals U+0041 U+1F600).
  • Codepunten → tekens: voer codepunten in (U+/0x/decimaal/\u) en klik op "Decoderen" om leesbare tekst te krijgen (inclusief samengestelde emoji).
  • Batch: meerdere tekens of codepunten in één keer converteren.
  • Richting: kies via de knoppen Coderen/Decoderen.

📌 Veelvoorkomende scenario's

  • Programmeren: omgaan met encodings en stringproblemen debuggen.
  • Data-analyse: bijzondere tekens en coderingen in tekstbestanden inspecteren.
  • Netwerkcommunicatie: controletekens/richting in protocollen begrijpen en debuggen.
  • Onderwijs: basis van computercodering en tekensets leren.
  • Security: onzichtbare tekens (zoals zero-width space/ZWJ) opsporen.
  • Formaatconversie: tussen verschillende coderingssystemen converteren.

🎛️ Conversieparameters & formaten

  • Codepuntnotatie: U+4E2D, U+0041.
  • Escape-sequentie: \u4E2D, \u0041.
  • Decimaal: 20013, 65.
  • Hexadecimaal: 0x4E2D, 0x0041.
  • Scheidingstekens: spaties, komma's of puntkomma's.

🧭 Gebruiksadvies

  • Tekstinvoer: typ of plak de inhoud.
  • Emoji-specifiek: sommige emoji bestaan uit meerdere codepunten (basis + variantselector + ZWJ).
  • Surrogatebewustzijn: tekens boven de BMP (> U+FFFF) verschijnen als UTF‑16-surrogateparen.

⚠️ Beperkingen & compatibiliteit

  • Ongeldige range: waarden <0 of >0x10FFFF worden geweigerd.
  • Weergave: de manier waarop tekens getoond worden, hangt af van platform en font.
  • Blokken: enkele historische blokken worden op sommige terminals/browsers niet goed weergegeven.

🔒 Privacy & veiligheid

  • Alle verwerking gebeurt in uw browser; gegevens verlaten uw apparaat niet.

❓ Veelgestelde vragen

Waarom wordt één teken soms als twee of meer UTF‑16-units weergegeven?

Omdat het codepunt buiten de BMP valt (> U+FFFF) en UTF‑16 hiervoor een surrogatepaar (hoog/laag) gebruikt.

Waarom bestaan sommige emoji uit meerdere codepunten?

Omdat ze samengestelde sequenties zijn (basis + variantselector + ZWJ‑verbinding).

Kan ik hex en decimaal door elkaar gebruiken?

Ja. U+/0x/\u/decimaal worden automatisch herkend; spaties/komma's/puntkomma's werken als scheidingstekens.

Wat is het verschil met ASCII?

ASCII bestrijkt 0–127; Unicode dekt vrijwel alle scripts en symbolen tot U+10FFFF.