mwultong Blog ... 프로그래밍 / 계산기

컴퓨터 엑셀 워드 포토샵 구글어스 WINDOWS JAVASCRIPT JAVA C++

 
Wednesday, December 20, 2006

유니코드 여부 판별, Unicode 인코딩 종류 자동 판단하는 법, 프로그램


어떤 텍스트 파일(Text File)이, 유니코드인지 아닌지 여부를 판별하거나, 유니코드라면, 어떤 종류의 유니코드인지 알아내는 방법은 여러가지가 있습니다.

가장 간단한 방법은 텍스트 에디터로 열어보는 것입니다.

윈도2000/윈도우XP이상의 운영체제에 설치된 메모장은 유니코드를 인식하고 편집할 수 있습니다.


우선 메모장으로 텍스트 파일을 불러온 후

파일 > 다른 이름으로 저장

으로 저장 대화상자를 엽니다.

"인코딩"이라는 목록에, 현재 파일의 인코딩이 자동으로 나타납니다.

* 현재 파일의 인코딩이 유니코드가 아닌, 그냥 한글 완성형이라면 ANSI 라고 나타날 것입니다.

* "UTF-8"이라고 되어 있다면, UTF-8 유니코드, 즉 "8비트 유니코드"로 되어 있는 것입니다.




그런데 메모장으로는 텍스트 파일을 정밀히 다룰 수 없습니다. 울트라에디트(UltraEdit)나, EmEditor(이엠에디터) 같은 전문적인 텍스트 편집기를 사용해야 합니다.


EmEditor 로 파일 인코딩 종류 판별


이엠에디터(EmEditor)에서, 텍스트 파일을 불러온 후, 화면 우측 하단에 보면, 파일의 인코딩 종류가 자세하고 정확히 나옵니다.

EmEditor 에서, 파일 종류를 판별할 경우:

* 유니코드가 아닌, 그냥 한글 완성형이라면 "한국어"라고 나옵니다.

* "유니코드"라면, UTF-16LE 라고 나옵니다.

* "유니코드(UTF-8)"이라면, UTF-8 이라고 나옵니다.


"with Signature"는 BOM 이 있다는 뜻
"without Signature"는 BOM 이 없다는 뜻입니다.

▶▶ [QnA] 유니코드 (Unicode) 의 BOM (Byte Order Mark) 이란?




유니코드에 대한 모든 게시물: 유니코드 | Unicode




tag: editor
텍스트 에디터 | 문서 편집기 | Text Editor

0 Comments:

<< Home RSS 2.0 feed

구글 Google 에서 제공하는 무료 블로그 서비스인 블로거 Blogger 의 인터넷 주소는 www.blogger.com 입니다. Blogger 에 블로그를 만들면, blogspot.com 이라는 주소에 블로그가 생성됩니다.
블로그를 직접 방문하지 않고도 최신 게시물을 구독하려면 RSS 2.0 feed 주소를 리더기에 등록하시면 됩니다.
Previous Posts
Monthly Archives
Top