ZAMKNIJ REKLAMĘ

Konwerter Unicode

Konwerter Unicode

Obsługuje dwukierunkową konwersję między znakami a punktami kodowymi Unicode, obsługuje emoji, pary zastępcze i tekst wielojęzyczny. Automatycznie wykrywa wiele formatów (U+, \u, 0x, dziesiętny), odpowiednie do debugowania kodowania znaków, analizy danych i wykrywania bezpieczeństwa.

Instrukcja użycia

🚀 Szybki start

  • Znaki → kod punkty: wpisz tekst, kliknij „Koduj”, aby zobaczyć sekwencję kodów (np. U+0041 U+1F600).
  • Kody → znaki: wpisz kody (U+/0x/dziesiętne/\u) i kliknij „Dekoduj”, aby otrzymać czytelny tekst (w tym złożone sekwencje emoji).
  • Przetwarzanie wsadowe: obsługa wielu znaków i wielu kodów jednocześnie.
  • Kierunek: przyciski Koduj/Dekoduj pozwalają płynnie przełączać kierunek konwersji.

📌 Typowe scenariusze

  • Programowanie: praca z kodowaniami i debugowanie problemów ze znakami.
  • Analiza danych: sprawdzanie obecności znaków specjalnych i ich kodów w plikach tekstowych.
  • Sieci i protokoły: rozumienie i debugowanie znaków sterujących/kierunkowych w protokołach.
  • Edukacja: nauka podstaw kodowania znaków i działania Unicode.
  • Bezpieczeństwo: wykrywanie niewidocznych znaków (np. spacje o zerowej szerokości/ZWJ).
  • Konwersja formatów: przełączanie między różnymi zapisami kodów (U+/0x/\u/dziesiętny).

🎛️ Parametry konwersji i formaty

  • Standardowy zapis: U+1F600, U+0041.
  • Sekwencje escape: \u1F600, \u0041.
  • Dziesiętny: 128512, 65.
  • Hex: 0x1F600, 0x0041.
  • Separatory: można mieszać spacje, przecinki i średniki; narzędzie rozdzieli je automatycznie.

🧭 Wskazówki użycia

  • Wejście tekstowe: wpisz lub wklej tekst, który chcesz przeanalizować.
  • Charakterystyka emoji: część emoji to sekwencje wielu kodów (podstawa + selektor wariantu + ZWJ).
  • Świadomość surogatów: znaki spoza BMP zwykle reprezentowane są jako para surogatów UTF‑16.

⚠️ Ograniczenia i kompatybilność

  • Zakres: wartości <0 lub >0x10FFFF są traktowane jako nieprawidłowe i odrzucane.
  • Renderowanie: sposób wyświetlania zależy od systemu i zastosowanej czcionki.
  • Widoczność bloków: nieliczne historyczne bloki znaków mogą nie być obsługiwane w części terminali/przeglądarek.

🔒 Prywatność i bezpieczeństwo

  • Całe przetwarzanie odbywa się w Twojej przeglądarce; dane nie opuszczają Twojego urządzenia.

❓ Najczęstsze pytania

Dlaczego jeden znak bywa reprezentowany przez dwa lub więcej elementów UTF‑16?

Ponieważ jego kod punktu leży poza BMP (> U+FFFF), więc w UTF‑16 używa się pary surogatów (górny/dolny).

Dlaczego niektóre emoji składają się z wielu kodów?

Część emoji to sekwencje złożone (znak bazowy + selektor wariantu + łącznik ZWJ).

Czy można mieszać zapis szesnastkowy i dziesiętny?

Tak. Wpisy U+/0x/\u oraz liczby dziesiętne są automatycznie rozpoznawane; separatory mogą stanowić spacje, przecinki lub średniki.

Czym Unicode różni się od ASCII?

ASCII obejmuje zakres 0–127, a Unicode obejmuje większość pism i symboli świata aż do U+10FFFF.