컴퓨터 엑셀 워드 포토숍 구글어스 WINDOWS JAVASCRIPT JAVA C++

 
Previous Post [엑셀] 루트 근사값 구하기, 제곱근/루트 기호 입력 방법: SQRT - Microsoft...윈도 XP] 환경변수 저장 파일은? / 패스(Path)가 저장된 레지스트리(Registry...[생활] 유리창/유리병의 스티커 자국을 흔적 없이 지우는 방법은? - Removing St...레지스트리 편집기 있는 곳, 윈도우 레지스트리 에디터 실행하는 법; Registry Edi...[배치 파일] 윈도의 .cmd 확장자를 가진 파일에 대해[건강] 모기 물린 데에 '계안' 혹은 '계안액'이라는 약이 효과가 좋더군요. (옛이름: ...[리눅스 QnA] 페도라 (Fedora Core 5) 다운로드하는 곳과 방법은? - Fed...[배치 파일 팁] echo문 행갈이 / 빈 줄 넣기/ 한 줄 띄어쓰기: Batch File...플래시겟(FlashGet) 무료화 / 플래쉬겟 다운로드 주소: 다운로드 도우미 프로그램[HTML-CSS] 한국어 웹문서 인코딩 charset 종류: euc-kr / UTF-8 ...

[QnA] 유니코드와 UTF-8 중, 어느쪽이 한자/특수기호가 더 많이 포함되어 있습니까?

Monday, July 31, 2006

UTF-8도 유니코드이고, 일반적인 유니코드(UTF-16)도 유니코드입니다. 그래서 유니코드와 UTF-8 에 포함된 문자들은 똑같습니다. 문자들의 분량도 똑같고, 각 문자들에 부여된 번호(코드)도 똑같습니다.

인터넷의 웹문서 즉 HTML 파일을 작성할 때는 반드시 UTF-8 유니코드를 사용해야 합니다.

그리고 MS윈도우나 MS오피스에서는 내부적으로 UTF-16 유니코드를 사용합니다. 그래서 오피스와 관련된 문서를 유니코드로 작성할 때에는, 일반 유니코드 즉 UTF-16 이 더 유리합니다.

UTF-8 과 UTF-16 은, 에디터로 간단히 상호 변환할 수 있습니다. 변환 도구로서 제가 추천하는 것은, EmEditor(이엠에디터)입니다. 울트라에디터는 유니코드를 변환할 때 파일이 깨지는 경우가 많더군요.


▶▶ '리틀 엔디안 little-endian 유니코드'와 '빅 엔디안 big-endian 유니코드'의 차이점

▶▶ [한글 코드] 유니코드 / 완성형 / 확장완성형 / 조합형의 차이점

2 Comments:
At 5:07 PM, Blogger mwultong said...

유니코드의 버전에 따라, 표현 가능한 문자들이 증가하더군요..

(∩_∩)

 
At 3:32 PM, Anonymous ddakji said...

UTF-8이나 UTF-16모두 문자표현 확장이 가능하기때문에 딱히 어느 하나가 더 많은 문자를 표현한다고 보기는 어려울 것 같고 크기나 호환성에서 차이가 날것이라 생각됩니다.

 

Post a Comment

<< Home RSS 2.0 feed

구글 Google 에서 제공하는 무료 블로그 서비스인 블로거 Blogger 의 인터넷 주소는 www.blogger.com 입니다. Blogger 에 블로그를 만들면, blogspot.com 이라는 주소에 블로그가 생성됩니다.
블로그를 직접 방문하지 않고도 최신 게시물을 구독하려면 RSS 2.0 feed 주소를 리더기에 등록하시면 됩니다.
Categories
Previous Posts
Monthly Archives
Top