Unicode-converter

Snelstart

1

Voer tekst of emoji in en klik op Coderen.

2

Voer U+, 0x, eenvoudige \u of decimale tokens in en klik op Decoderen.

3

Scheid meerdere tokens met spaties, komma’s, puntkomma’s of nieuwe regels.

4

Controleer het resultaat in dezelfde editor en kopieer het.

Veelvoorkomende scenario's

Programmeren

omgaan met encodings en stringproblemen debuggen.

Data-analyse

bijzondere tekens en coderingen in tekstbestanden inspecteren.

Protocoltekst

inspecteer geplakte payload-tekst als codepunten en UTF-8/UTF-16-representaties zonder pakketbytes te decoderen

Onderwijs

basis van computercodering en tekensets leren.

Beveiligingsbeoordeling

controle van nulbreedte, variatiekiezer, ZWJ of controlecodepunten zonder een volledig verwarrend/bidi-rapport

Formaatconversie

schakel tussen leesbare tekst en codepunttokens

Conversieparameters & formaten

Codepuntnotatie: U+4E2D, U+0041.

Eenvoudig token:\u4E2D,\u0041. Dit is token-parsing, geen letterlijke JavaScript-stringparser.

Decimaal: 20013, 65.

Hexadecimaal: 0x4E2D, 0x0041.

Scheidingstekens: spaties, komma's, puntkomma's of nieuwe regels. Kale tokens zijn decimaal; voeg U+, 0x of \u toe voor hex.

Codepuntgrenzen

Encode voert altijd een U+-codepuntenlijst uit. Decimale waarden, UTF-8-bytes, UTF-16-eenheden en surrogaatparen worden in details weergegeven, niet als alternatieve uitvoerformaten.

Decoderen accepteert U+, 0x, eenvoudige \u en decimale tokens. Het behandelt kale hexadecimale getallen zoals 1F600 niet als hexadecimaal.

Eenvoudige \u-tokenparsering is geen tekenreeksparser van JavaScript: \u{1F600}, \U0001F600, \xNN, CSS-escapes, HTML-entiteiten en URL-percentagecodering vallen buiten dit hulpprogramma.

Karakterdetails tonen de eerste 100 unieke codepunten met aantallen voorvallen. Lange emoji-reeksen en combinatiemarkeringen worden geïnspecteerd als codepunten, niet als grafeemclusters.

Blok-, categorie- en emoji-labels zijn lichtgewicht lokale hints. De pagina is geen officiële Unicode-naam, versie, script, bidi of normalisatiedatabase.

U kunt de nulbreedte, variatie, controle of ongebruikelijke codepunten ter plekke controleren, maar dit is geen verwarrende, bidi-, Trojaanse bron-, IDN- of lettertypedekkingsscanner.

Unicode-codepuntconversie gebeurt lokaal in de browser. De brontekst kan als browserconcept blijven staan. Als een opgeslagen werkruimte of WebDAV-synchronisatie is ingeschakeld, kan die tekst ook via die synchronisatie worden opgeslagen. Encode, Decode en gekopieerde tekst gebruiken allemaal dezelfde editorinhoud; tekendetails worden opnieuw uit die inhoud berekend en niet als afzonderlijke resultaatstatus opgeslagen. Deze tool uploadt geen bestanden, maakt geen bijlagen en exporteert geen bestanden.

Gebruiksadvies

Tekstinvoer: typ of plak de inhoud.

Emoji-specificaties: sommige emoji zijn samengesteld uit meerdere codepunten (basis + modifiers + variatiekiezer + ZWJ)

Surrogaatbewustzijn: tekens buiten de BMP(> U+FFFF) verschijnen als UTF‑16 surrogaatparen in JavaScript-reeksen

Beperkingen & compatibiliteit

Ongeldig bereik: waarden <0 of >0x10FFFF worden afgewezen. Alleenstaande surrogaatcodepunten kunnen in verschillende browsers inconsistent worden weergegeven.

Rendering: weergave verschilt per platform/lettertype

Blok- en categorielabels zijn lichtgewicht lokale hints, geen volledige Unicode-database met officiële namen, scripts of bidi-gegevens.

Privacy & veiligheid

Unicode-codepuntconversie gebeurt lokaal in de browser. De brontekst kan als browserconcept blijven staan. Als een opgeslagen werkruimte of WebDAV-synchronisatie is ingeschakeld, kan die tekst ook via die synchronisatie worden opgeslagen. Encode, Decode en gekopieerde tekst gebruiken allemaal dezelfde editorinhoud; tekendetails worden opnieuw uit die inhoud berekend en niet als afzonderlijke resultaatstatus opgeslagen. Deze tool uploadt geen bestanden, maakt geen bijlagen en exporteert geen bestanden.

Snelstart

Veelvoorkomende scenario's

Programmeren

Data-analyse

Protocoltekst

Onderwijs

Beveiligingsbeoordeling

Formaatconversie

Conversieparameters & formaten

Codepuntgrenzen

Gebruiksadvies

Beperkingen & compatibiliteit

Privacy & veiligheid

Veelgestelde vragen

Waarom wordt één teken soms als twee of meer UTF‑16-units weergegeven?

Waarom bestaan sommige emoji uit meerdere codepunten?

Kan ik hex en decimaal door elkaar gebruiken?

Ondersteunt dit JavaScript \u{1F600} of CSS-escapes?

Waarom verschillen blokken of categorieën van Unicode-databases?

Is dit een UTF-8- of UTF-16-byteconverter?

Wat is het verschil met ASCII?

Snelstart

Veelvoorkomende scenario's

Programmeren

Data-analyse

Protocoltekst

Onderwijs

Beveiligingsbeoordeling

Formaatconversie

Conversieparameters & formaten

Codepuntgrenzen

Gebruiksadvies

Beperkingen & compatibiliteit

Privacy & veiligheid

Veelgestelde vragen

Waarom wordt één teken soms als twee of meer UTF‑16-units weergegeven?

Waarom bestaan sommige emoji uit meerdere codepunten?

Kan ik hex en decimaal door elkaar gebruiken?

Ondersteunt dit JavaScript \u{1F600} of CSS-escapes?

Waarom verschillen blokken of categorieën van Unicode-databases?

Is dit een UTF-8- of UTF-16-byteconverter?

Wat is het verschil met ASCII?

Gerelateerde tools