Unicode 변환기
텍스트를 Unicode로 변환하거나 복원합니다
Unicode 변환기는 텍스트를 유니코드 이스케이프 시퀀스(\uXXXX)나 HEX 코드로 변환하거나, 반대로 유니코드 코드를 읽을 수 있는 문자로 복원하는 도구입니다. 이모지의 정확한 코드포인트 확인, 프로그래밍 시 비ASCII 문자 이스케이프, 국제화(i18n) 작업에서 문자 인코딩 디버깅 등 다양한 용도로 활용됩니다. 한글, 일본어, 중국어, 이모지 등 모든 유니코드 문자를 지원합니다.
📖 사용법
- 입력창에 텍스트 또는 유니코드를 입력하세요
- 원하는 변환 방향 버튼을 클릭하세요
- 유니코드 이스케이프, HEX 변환 가능
- 결과를 복사하여 사용하세요
✨ 주요 기능
- ✓유니코드 이스케이프 변환
- ✓HEX 코드 변환
- ✓양방향 변환 지원
- ✓이모지 유니코드 확인
- ✓한글 유니코드 분석
💡 활용 사례
- •프론트엔드 개발자: JavaScript 소스코드에서 비ASCII 문자를 \u 이스케이프로 변환하여 인코딩 문제를 방지합니다.
- •국제화(i18n) 엔지니어: 다국어 문자열의 유니코드 코드포인트를 확인하여 인코딩 오류를 디버깅합니다.
- •이모지 연구자: 이모지의 유니코드 코드포인트와 구성(결합 문자, ZWJ 시퀀스 등)을 분석합니다.
- •데이터베이스 관리자: 특수문자나 보이지 않는 문자(제로 폭 공백 등)의 유니코드 코드를 식별하여 데이터 정합성을 점검합니다.
- •기술 문서 작성자: 유니코드 문자 참조표를 만들거나 코드포인트를 문서에 기록합니다.
🎯 활용 팁
- ▸이모지를 입력하면 서로게이트 페어(surrogate pair)나 결합 시퀀스를 확인할 수 있어 이모지 처리 로직을 테스트하기 좋습니다.
- ▸보이지 않는 문자(제로 폭 공백, BOM 등)가 의심되면 텍스트를 유니코드로 변환하여 숨겨진 문자를 찾아내세요.
- ▸JSON 파일에서 한글이 \uXXXX로 표시되었을 때 이 도구로 디코딩하면 원본 문자를 바로 확인할 수 있습니다.
- ▸HEX 변환은 프로토콜 분석이나 바이트 단위 데이터 처리 시 유용합니다.
❓ 자주 묻는 질문
Q. 유니코드와 UTF-8의 차이는?
A. 유니코드는 문자 집합이고, UTF-8은 유니코드를 인코딩하는 방식 중 하나입니다.
Q. 이모지도 변환되나요?
A. 네, 이모지를 포함한 모든 유니코드 문자를 변환할 수 있습니다.
Q. \uXXXX와 \u{XXXXX}의 차이는?
A. \uXXXX는 BMP(기본 다국어 평면) 내의 16비트 코드포인트만 표현합니다. 이모지 등 BMP 밖의 문자는 \u{1F600} 형태나 서로게이트 페어(\uD83D\uDE00)로 표현해야 합니다.
Q. 한글의 유니코드 범위는 어떻게 되나요?
A. 한글 자모는 U+3131~U+318E, 완성형 한글은 U+AC00~U+D7A3 범위입니다. 총 11,172개의 완성형 한글 음절이 유니코드에 포함되어 있습니다.
Q. 제로 폭 문자란 무엇인가요?
A. 화면에 보이지 않는 유니코드 문자입니다. 제로 폭 공백(U+200B), 제로 폭 결합자(U+200D), BOM(U+FEFF) 등이 있으며, 복사-붙여넣기 시 의도치 않게 포함되어 버그를 유발하기도 합니다.
Q. HEX 코드와 유니코드 코드포인트의 차이는?
A. 유니코드 코드포인트(U+AC00)는 문자의 고유 번호이고, HEX 코드는 해당 문자가 특정 인코딩(UTF-8 등)으로 저장될 때의 바이트 값입니다. 같은 문자라도 인코딩 방식에 따라 HEX 값이 달라집니다.
🔗 관련 도구
이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다.