Wednesday, December 20, 2006
유니코드 여부 판별, Unicode 인코딩 종류 자동 판단하는 법, 프로그램
어떤 텍스트 파일(Text File)이, 유니코드인지 아닌지 여부를 판별하거나, 유니코드라면, 어떤 종류의 유니코드인지 알아내는 방법은 여러가지가 있습니다.
가장 간단한 방법은 텍스트 에디터로 열어보는 것입니다.
윈도2000/윈도우XP이상의 운영체제에 설치된 메모장은 유니코드를 인식하고 편집할 수 있습니다.
우선 메모장으로 텍스트 파일을 불러온 후
으로 저장 대화상자를 엽니다.
"인코딩"이라는 목록에, 현재 파일의 인코딩이 자동으로 나타납니다.
* 현재 파일의 인코딩이 유니코드가 아닌, 그냥 한글 완성형이라면 ANSI 라고 나타날 것입니다.
* "UTF-8"이라고 되어 있다면, UTF-8 유니코드, 즉 "8비트 유니코드"로 되어 있는 것입니다.
그런데 메모장으로는 텍스트 파일을 정밀히 다룰 수 없습니다. 울트라에디트(UltraEdit)나, EmEditor(이엠에디터) 같은 전문적인 텍스트 편집기를 사용해야 합니다.
이엠에디터(EmEditor)에서, 텍스트 파일을 불러온 후, 화면 우측 하단에 보면, 파일의 인코딩 종류가 자세하고 정확히 나옵니다.
EmEditor 에서, 파일 종류를 판별할 경우:
* 유니코드가 아닌, 그냥 한글 완성형이라면 "한국어"라고 나옵니다.
* "유니코드"라면, UTF-16LE 라고 나옵니다.
* "유니코드(UTF-8)"이라면, UTF-8 이라고 나옵니다.
"with Signature"는 BOM 이 있다는 뜻
"without Signature"는 BOM 이 없다는 뜻입니다.
▶▶ [QnA] 유니코드 (Unicode) 의 BOM (Byte Order Mark) 이란?
유니코드에 대한 모든 게시물: ☞ 유니코드 | Unicode
가장 간단한 방법은 텍스트 에디터로 열어보는 것입니다.
윈도2000/윈도우XP이상의 운영체제에 설치된 메모장은 유니코드를 인식하고 편집할 수 있습니다.
우선 메모장으로 텍스트 파일을 불러온 후
파일 > 다른 이름으로 저장
으로 저장 대화상자를 엽니다.
"인코딩"이라는 목록에, 현재 파일의 인코딩이 자동으로 나타납니다.
* 현재 파일의 인코딩이 유니코드가 아닌, 그냥 한글 완성형이라면 ANSI 라고 나타날 것입니다.
* "UTF-8"이라고 되어 있다면, UTF-8 유니코드, 즉 "8비트 유니코드"로 되어 있는 것입니다.
그런데 메모장으로는 텍스트 파일을 정밀히 다룰 수 없습니다. 울트라에디트(UltraEdit)나, EmEditor(이엠에디터) 같은 전문적인 텍스트 편집기를 사용해야 합니다.
EmEditor 로 파일 인코딩 종류 판별
이엠에디터(EmEditor)에서, 텍스트 파일을 불러온 후, 화면 우측 하단에 보면, 파일의 인코딩 종류가 자세하고 정확히 나옵니다.
EmEditor 에서, 파일 종류를 판별할 경우:
* 유니코드가 아닌, 그냥 한글 완성형이라면 "한국어"라고 나옵니다.
* "유니코드"라면, UTF-16LE 라고 나옵니다.
* "유니코드(UTF-8)"이라면, UTF-8 이라고 나옵니다.
"with Signature"는 BOM 이 있다는 뜻
"without Signature"는 BOM 이 없다는 뜻입니다.
▶▶ [QnA] 유니코드 (Unicode) 의 BOM (Byte Order Mark) 이란?
유니코드에 대한 모든 게시물: ☞ 유니코드 | Unicode
tag: editor
텍스트 에디터 | 문서 편집기 | Text Editor
<< Home