Saturday, May 20, 2006

'리틀 엔디안 little-endian 유니코드'와 '빅 엔디안 big-endian 유니코드'의 차이점

MS윈도에서 내부적으로 사용되는 유니코드(UTF-16LE)는 16비트 즉 2바이트로 하나의 글자를 표현합니다. 바이트가 2개니까 이 바이트에 순서가 정해져 있어야 합니다. big-endian 은 있는 순서 그대로 바이트를 자연스럽게 나열하는 것이고, little-endian 은 속도를 빠르게 하기 위해서 거꾸로 나열하는 것입니다.

MS윈도의 유니코드는 리틀 엔디안 little-endian이 기본값입니다. 빅 엔디안 유니코드는, 울트라에디터 v11 등의 일부 프로그램에서 전혀 인식하지 못했습니다.

반면 UTF-8 에는 리틀 엔디안이나 빅 엔디안의 구분이 없습니다.

유니코드 중에서는 UTF-8 이 가장 무난했습니다. 그래서 저의 경우, 어떤 텍스트 파일을 유니코드로 저장해야 할 때는 모두 UTF-8 로 저장하고 있습니다.

관련 게시물:

▶▶ [QnA] 유니코드 (Unicode) 의 BOM (Byte Order Mark) 이란?

tag: editor

텍스트 에디터 | 문서 편집기 | Text Editor

0 Comments:

<< Home

구글 Google 에서 제공하는 무료 블로그 서비스인 블로거 Blogger 의 인터넷 주소는 www.blogger.com 입니다. Blogger 에 블로그를 만들면, blogspot.com 이라는 주소에 블로그가 생성됩니다.

블로그를 직접 방문하지 않고도 최신 게시물을 구독하려면

주소를 리더기에 등록하시면 됩니다.

Monthly Archives

Top