Unicode 변환기
텍스트와 이모지를 Unicode 코드 포인트로 변환하고, 접두사가 있는 16진수 또는 10진수 토큰을 디코딩하며, UTF-8 바이트, UTF-16 단위, 서로게이트 페어를 로컬에서 확인합니다.
입력 텍스트
문자
0 / 50,000
빠른 시작
자주 쓰는 활용 사례
프로그래밍
인코딩 처리, 문자열 문제 디버깅
데이터 분석
텍스트의 특수 문자/인코딩 검사
프로토콜 텍스트
패킷 바이트를 디코딩하지 않고 코드 포인트 및 UTF-8/UTF-16 표현으로 붙여넣은 페이로드 텍스트를 검사합니다.
교육
문자 인코딩 기초 학습
보안 검토
전체 confusable/bidi 보고서 없이 제로 폭, 변형 선택기, ZWJ 또는 제어 코드 포인트를 점검합니다.
형식 변환
읽을 수 있는 텍스트와 코드 포인트 토큰 간 전환
변환 매개변수 및 형식
코드 포인트 경계
활용 팁
제한 사항 및 호환성
개인정보 보호 및 보안
자주 묻는 질문
BMP 밖(> U+FFFF)의 문자는 UTF‑16에서 서로게이트 페어(상위/하위)를 사용하기 때문
일부 이모티콘은 복합 시퀀스(기본 + 수정자 + 변형 선택기 + ZWJ)입니다. 이 도구는 코드 포인트를 표시하지만 문자소 클러스터 또는 이모티콘 표준의 유효성을 검사하지는 않습니다.
그렇습니다. U+, 0x, 단순 \u 및 소수 토큰을 혼합할 수 있습니다. 16진수 값에는 접두사를 사용하세요. 접두사가 없는 토큰은 10진수로 처리됩니다.
지원하지 않습니다. 디코딩은 U+, 0x, 단순 \u, 10진수 토큰만 파싱합니다. JavaScript 중괄호 escape, CSS escape, HTML 엔터티, URL 퍼센트 인코딩은 별도 도구 영역입니다.
상세 카드는 로컬의 가벼운 범위표와 휴리스틱 라벨을 사용합니다. 공식 Unicode 이름, 버전, 스크립트, bidi 클래스, 정규화 데이터는 포함하지 않습니다.
아닙니다. 상세 카드에 UTF-8 바이트와 UTF-16 단위를 표시하지만, 붙여넣은 바이트 스트림, 바이트 순서 또는 다른 문자셋은 디코딩하지 않습니다.
ASCII 는 0–127, Unicode 는 U+10FFFF까지 전 세계 문자/기호를 포함