Monday, July 31, 2006
QnA: 유니코드와 UTF-8 중, 어느쪽이 한자/특수기호가 더 많이 포함되어 있습니까?
UTF-8도 유니코드이고, 일반적인 유니코드(UTF-16)도 유니코드입니다. 그래서 유니코드와 UTF-8 에 포함된 문자들은 똑같습니다. 문자들의 분량도 똑같고, 각 문자들에 부여된 번호(코드)도 똑같습니다.
인터넷의 웹문서 즉 HTML 파일을 작성할 때는 반드시 UTF-8 유니코드를 사용해야 합니다.
그리고 MS윈도우나 MS오피스에서는 내부적으로 UTF-16 유니코드를 사용합니다. 그래서 오피스와 관련된 문서를 유니코드로 작성할 때에는, 일반 유니코드 즉 UTF-16 이 더 유리합니다.
UTF-8 과 UTF-16 은, 에디터로 간단히 상호 변환할 수 있습니다. 변환 도구로서 제가 추천하는 것은, EmEditor(이엠에디터)입니다. 울트라에디터는 유니코드를 변환할 때 파일이 깨지는 경우가 많더군요.
▶▶ '리틀 엔디안 little-endian 유니코드'와 '빅 엔디안 big-endian 유니코드'의 차이점
▶▶ [한글 코드] 유니코드 / 완성형 / 확장완성형 / 조합형의 차이점
인터넷의 웹문서 즉 HTML 파일을 작성할 때는 반드시 UTF-8 유니코드를 사용해야 합니다.
그리고 MS윈도우나 MS오피스에서는 내부적으로 UTF-16 유니코드를 사용합니다. 그래서 오피스와 관련된 문서를 유니코드로 작성할 때에는, 일반 유니코드 즉 UTF-16 이 더 유리합니다.
UTF-8 과 UTF-16 은, 에디터로 간단히 상호 변환할 수 있습니다. 변환 도구로서 제가 추천하는 것은, EmEditor(이엠에디터)입니다. 울트라에디터는 유니코드를 변환할 때 파일이 깨지는 경우가 많더군요.
▶▶ '리틀 엔디안 little-endian 유니코드'와 '빅 엔디안 big-endian 유니코드'의 차이점
▶▶ [한글 코드] 유니코드 / 완성형 / 확장완성형 / 조합형의 차이점
tag: editor
텍스트 에디터 | 문서 편집기 | Text Editor
유니코드의 버전에 따라, 표현 가능한 문자들이 증가하더군요..
(∩_∩)
UTF-8이나 UTF-16모두 문자표현 확장이 가능하기때문에 딱히 어느 하나가 더 많은 문자를 표현한다고 보기는 어려울 것 같고 크기나 호환성에서 차이가 날것이라 생각됩니다.
<< Home