컴퓨터 엑셀 워드 포토숍 구글어스 WINDOWS JAVASCRIPT JAVA C++

 
Previous Post PDF파일 보는 방법; PDF File 읽는 법홍시 사진, 씨없는 감; 경북 청도 반시? × 홍씨; persimmonCDRW 프로그램; RWCD CD-RW 굽기 소프트웨어는?ISO 파일 사용법 기초; ISO File 사용하는 방법엑셀에서 셀 늘이는 법, 칸 늘이기; x 늘리는 방법, 늘리기; Excel Cell Res...blogspot의 ISP접속 차단 완전 해제, 구글 청소년 보호 담당자님께도 메일니콘의 기계식 카메라 종류는? Nikon mechanical SLR디지털카메라 장점 단점; 필카와의 장단점 비교; Dica정보통신윤리위원회 blogspot.com 서버IP접속 차단 해제 요청LG파워콤에서도 blogspot.com 이 접속 차단되었군요

유니코드의 종류; Unicode 인코딩들의 차이점

Thursday, November 08, 2007

유니코드의 종류는 크게 3가지가 있습니다.

UTF-16 LE
컴퓨터에서 그냥 "유니코드"라고 부를 때에는 이 UTF-16 LE 를 가리키는 경우가 많습니다. MS윈도우2000이나 윈도우XP에서 내부적으로 사용되는 유니코드입니다. 그렇다고 해서 마이크로소프트(MS)가 개발했다는 뜻은 아니고, 표준 유니코드 중의 하나입니다. 문자 1개를 16비트로 표현하는데, 앞의 8비트와 뒤의 8비트의 순서가 거꾸로 되어 있습니다. 인텔CPU가 Little-Endian 이기에, 유니코드도 앞뒤 바이트 순서를 바꾸면 이론적으로 더 처리 속도가 빨라집니다.


UTF-8
이것은 인터넷이나, 리눅스/유닉스 등에서 사용하는 8비트 유니코드입니다. 웹페이지 관련 작업에서 "유니코드"라고 할 때에는 이 UTF-8 유니코드를 가리킵니다. 영문이나 숫자 등은 1바이트로 표현하고, 한글이나 한자 등은 3바이트로 표현합니다. 웹페이지를 유니코드 인코딩으로 만들 때에는 반드시 "UTF-8 유니코드"를 사용해야 합니다. 8비트 유니코드라고 해서, 16비트 유니코드보다 문자 표현 범위가 작다든지 그런 것은 전혀 없고 동일합니다.


UTF-16 BE
BE는 Big-Endian 의 약자입니다. 이것은 맥(Mac)이나 자바(Java)에서 사용되는 16비트 유니코드인데, 앞뒤 바이트 순서가 거꾸로 바뀌지 않고 그대로 있는 것입니다. UTF-16 BE 는 윈도우에서는 거의 사용되지 않습니다.


MS오피스 관련 작업에서 유니코드를 사용할 때에는 맨 처음의 "UTF-16 LE (일명, 그냥 '유니코드')"를 사용하는 것이 좋습니다. 그렇지 않으면 에러가 발생할 가능성이 높습니다.


유니코드 관련 포스트 참조: 유니코드 | Unicode


0 Comments:

Post a Comment

<< Home RSS 2.0 feed

구글 Google 에서 제공하는 무료 블로그 서비스인 블로거 Blogger 의 인터넷 주소는 www.blogger.com 입니다. Blogger 에 블로그를 만들면, blogspot.com 이라는 주소에 블로그가 생성됩니다.
블로그를 직접 방문하지 않고도 최신 게시물을 구독하려면 RSS 2.0 feed 주소를 리더기에 등록하시면 됩니다.
Categories
Previous Posts
Monthly Archives
Top