mwultong Blog ... 프로그래밍 / 계산기

컴퓨터 엑셀 워드 포토샵 구글어스 WINDOWS JAVASCRIPT JAVA C++

 
Monday, July 31, 2006

QnA: 유니코드와 UTF-8 중, 어느쪽이 한자/특수기호가 더 많이 포함되어 있습니까?


UTF-8도 유니코드이고, 일반적인 유니코드(UTF-16)도 유니코드입니다. 그래서 유니코드와 UTF-8 에 포함된 문자들은 똑같습니다. 문자들의 분량도 똑같고, 각 문자들에 부여된 번호(코드)도 똑같습니다.

인터넷의 웹문서 즉 HTML 파일을 작성할 때는 반드시 UTF-8 유니코드를 사용해야 합니다.

그리고 MS윈도우나 MS오피스에서는 내부적으로 UTF-16 유니코드를 사용합니다. 그래서 오피스와 관련된 문서를 유니코드로 작성할 때에는, 일반 유니코드 즉 UTF-16 이 더 유리합니다.

UTF-8 과 UTF-16 은, 에디터로 간단히 상호 변환할 수 있습니다. 변환 도구로서 제가 추천하는 것은, EmEditor(이엠에디터)입니다. 울트라에디터는 유니코드를 변환할 때 파일이 깨지는 경우가 많더군요.


▶▶ '리틀 엔디안 little-endian 유니코드'와 '빅 엔디안 big-endian 유니코드'의 차이점

▶▶ [한글 코드] 유니코드 / 완성형 / 확장완성형 / 조합형의 차이점



tag: editor
텍스트 에디터 | 문서 편집기 | Text Editor

2 Comments:
At July 31, 2006 at 5:07 PM, Blogger mwultong said...

유니코드의 버전에 따라, 표현 가능한 문자들이 증가하더군요..

(∩_∩)

 
At April 1, 2007 at 3:32 PM, Anonymous Anonymous said...

UTF-8이나 UTF-16모두 문자표현 확장이 가능하기때문에 딱히 어느 하나가 더 많은 문자를 표현한다고 보기는 어려울 것 같고 크기나 호환성에서 차이가 날것이라 생각됩니다.

 

<< Home RSS 2.0 feed

구글 Google 에서 제공하는 무료 블로그 서비스인 블로거 Blogger 의 인터넷 주소는 www.blogger.com 입니다. Blogger 에 블로그를 만들면, blogspot.com 이라는 주소에 블로그가 생성됩니다.
블로그를 직접 방문하지 않고도 최신 게시물을 구독하려면 RSS 2.0 feed 주소를 리더기에 등록하시면 됩니다.
Previous Posts
Monthly Archives
Top