Konwerter Unicode

Szybki start

1

Wpisz tekst lub emoji i kliknij Koduj.

2

Wpisz U+, 0x, proste \u lub tokeny dziesiętne i kliknij Dekoduj.

3

Oddziel wiele tokenów spacjami, przecinkami, średnikami lub nowymi liniami.

4

Sprawdź wynik w tym samym edytorze i skopiuj go.

Typowe scenariusze

Programowanie

praca z kodowaniami i debugowanie problemów ze znakami.

Analiza danych

sprawdzanie obecności znaków specjalnych i ich kodów w plikach tekstowych.

Tekst protokołu

sprawdź wklejony tekst ładunku jako punkty kodowe i reprezentacje UTF-8/UTF-16 bez dekodowania bajtów pakietu

Edukacja

nauka podstaw kodowania znaków i działania Unicode.

Przegląd bezpieczeństwa

wyrywkowe sprawdzanie szerokości zerowej, selektora odmian, ZWJ lub kontrolnych punktów kodowych bez pełnego raportu o możliwości pomylenia/bidi

Konwersja formatu

przełączaj między czytelnym tekstem a tokenami punktów kodowych

Parametry konwersji i formaty

Standardowy zapis: U+1F600, U+0041.

Prosty token \u:\u4E2D,\u0041. To jest analiza tokenów, a nie analizator literału ciągu JavaScript.

Dziesiętny: 128512, 65.

Hex: 0x1F600, 0x0041.

Separatory: spacje, przecinki, średniki lub nowe linie. Gołe tokeny są dziesiętne; dodaj U+, 0x lub \u dla szesnastkowego.

Granice punktów kodowych

Encode zawsze generuje listę punktów kodowych U+. Wartości dziesiętne, bajty UTF-8, jednostki UTF-16 i pary zastępcze są wyświetlane szczegółowo, a nie jako alternatywne formaty wyjściowe.

Dekodowanie akceptuje tokeny U+, 0x, proste \u i dziesiętne. Nie traktuje gołego szesnastkowego, takiego jak 1F600, jako szesnastkowego.

Proste analizowanie tokenów \u nie jest analizatorem ciągów JavaScript: \u{1F600}, \U0001F600, \xNN, znaki specjalne CSS, elementy HTML i kodowanie procentowe URL nie mieszczą się w tym narzędziu.

Szczegóły postaci pokazują pierwsze 100 unikalnych punktów kodowych wraz z liczbą wystąpień. Długie sekwencje emoji i znaki łączenia są sprawdzane jako punkty kodowe, a nie klastry grafemów.

Etykiety bloków, kategorii i emoji to lekkie wskazówki lokalne. Strona nie jest oficjalną nazwą, wersją, skryptem, bidi ani bazą danych normalizacji Unicode.

Możesz punktowo sprawdzić zerową szerokość, zmienność, kontrolę lub nietypowe punkty kodowe, ale nie jest to skaner, który można pomylić, bidi, źródło trojana, IDN lub pokrycie czcionek.

Konwersja punktów kodowych Unicode działa lokalnie w przeglądarce. Tekst źródłowy może pozostać jako szkic przeglądarki. Jeśli włączony jest zapisany obszar roboczy lub synchronizacja WebDAV, ten tekst może zostać zapisany także przez tę synchronizację. Encode, Decode i kopiowany tekst używają tej samej zawartości edytora; szczegóły znaków są ponownie obliczane z tej zawartości i nie są zapisywane jako osobny stan wyniku. To narzędzie nie przesyła plików, nie tworzy załączników ani nie eksportuje plików.

Wskazówki użycia

Wejście tekstowe: wpisz lub wklej tekst, który chcesz przeanalizować.

Specyfika emoji: niektóre emoji składają się z wielu punktów kodowych (baza + modyfikatory + selektor odmian + ZWJ)

Świadomość zastępcza: znaki poza BMP(> U+FFFF) pojawiają się jako pary zastępcze UTF‑16 w ciągach JavaScript

Ograniczenia i kompatybilność

Nieprawidłowy zakres: wartości <0 lub >0x10FFFF są odrzucane. Pojedyncze punkty kodu zastępczego mogą być wyświetlane niespójnie w różnych przeglądarkach.

Renderowanie: wyświetlanie różni się w zależności od platformy/czcionki

Etykiety bloków i kategorii to lekkie wskazówki lokalne, a nie pełna baza danych Unicode z oficjalnymi nazwami, skryptami lub danymi bidi.

Prywatność i bezpieczeństwo

Konwersja punktów kodowych Unicode działa lokalnie w przeglądarce. Tekst źródłowy może pozostać jako szkic przeglądarki. Jeśli włączony jest zapisany obszar roboczy lub synchronizacja WebDAV, ten tekst może zostać zapisany także przez tę synchronizację. Encode, Decode i kopiowany tekst używają tej samej zawartości edytora; szczegóły znaków są ponownie obliczane z tej zawartości i nie są zapisywane jako osobny stan wyniku. To narzędzie nie przesyła plików, nie tworzy załączników ani nie eksportuje plików.

Szybki start

Typowe scenariusze

Programowanie

Analiza danych

Tekst protokołu

Edukacja

Przegląd bezpieczeństwa

Konwersja formatu

Parametry konwersji i formaty

Granice punktów kodowych

Wskazówki użycia

Ograniczenia i kompatybilność

Prywatność i bezpieczeństwo

Najczęstsze pytania

Dlaczego jeden znak bywa reprezentowany przez dwa lub więcej elementów UTF‑16?

Dlaczego niektóre emoji składają się z wielu kodów?

Czy można mieszać zapis szesnastkowy i dziesiętny?

Czy obsługuje JavaScript \u{1F600} albo escape CSS?

Dlaczego blok lub kategoria różnią się od baz Unicode?

Czy to konwerter bajtów UTF-8 lub UTF-16?

Czym Unicode różni się od ASCII?

Szybki start

Typowe scenariusze

Programowanie

Analiza danych

Tekst protokołu

Edukacja

Przegląd bezpieczeństwa

Konwersja formatu

Parametry konwersji i formaty

Granice punktów kodowych

Wskazówki użycia

Ograniczenia i kompatybilność

Prywatność i bezpieczeństwo

Najczęstsze pytania

Dlaczego jeden znak bywa reprezentowany przez dwa lub więcej elementów UTF‑16?

Dlaczego niektóre emoji składają się z wielu kodów?

Czy można mieszać zapis szesnastkowy i dziesiętny?

Czy obsługuje JavaScript \u{1F600} albo escape CSS?

Dlaczego blok lub kategoria różnią się od baz Unicode?

Czy to konwerter bajtów UTF-8 lub UTF-16?

Czym Unicode różni się od ASCII?

Powiązane narzędzia