Saturday, May 20, 2006
'리틀 엔디안 little-endian 유니코드'와 '빅 엔디안 big-endian 유니코드'의 차이점
MS윈도에서 내부적으로 사용되는 유니코드(UTF-16LE)는 16비트 즉 2바이트로 하나의 글자를 표현합니다. 바이트가 2개니까 이 바이트에 순서가 정해져 있어야 합니다. big-endian 은 있는 순서 그대로 바이트를 자연스럽게 나열하는 것이고, little-endian 은 속도를 빠르게 하기 위해서 거꾸로 나열하는 것입니다.
MS윈도의 유니코드는 리틀 엔디안 little-endian이 기본값입니다. 빅 엔디안 유니코드는, 울트라에디터 v11 등의 일부 프로그램에서 전혀 인식하지 못했습니다.
반면 UTF-8 에는 리틀 엔디안이나 빅 엔디안의 구분이 없습니다.
유니코드 중에서는 UTF-8 이 가장 무난했습니다. 그래서 저의 경우, 어떤 텍스트 파일을 유니코드로 저장해야 할 때는 모두 UTF-8 로 저장하고 있습니다.
관련 게시물:
▶▶ [QnA] 유니코드 (Unicode) 의 BOM (Byte Order Mark) 이란?
MS윈도의 유니코드는 리틀 엔디안 little-endian이 기본값입니다. 빅 엔디안 유니코드는, 울트라에디터 v11 등의 일부 프로그램에서 전혀 인식하지 못했습니다.
반면 UTF-8 에는 리틀 엔디안이나 빅 엔디안의 구분이 없습니다.
유니코드 중에서는 UTF-8 이 가장 무난했습니다. 그래서 저의 경우, 어떤 텍스트 파일을 유니코드로 저장해야 할 때는 모두 UTF-8 로 저장하고 있습니다.
관련 게시물:
▶▶ [QnA] 유니코드 (Unicode) 의 BOM (Byte Order Mark) 이란?
tag: editor
텍스트 에디터 | 문서 편집기 | Text Editor
<< Home