컴퓨터 엑셀 워드 포토샵 구글어스 WINDOWS JAVASCRIPT JAVA C++

 
Saturday, May 20, 2006

한글 텍스트 문서를, 유니코드(Unicode / UTF-8) 로 변환하기


아래의 여러가지 방법으로, 한글 아스키 텍스트 파일(.TXT)을 유니코드 인코딩으로 변환할 수 있습니다.

참고로, 윈도우에서의 일반적인 "유니코드(Unicode)"란, UTF-16 LE (Little Endian) 를 의미합니다.

한편, 인터넷 웹페이지용으로 사용할 유니코드 HTML 파일이라면 반드시 UTF-8 로 저장해야 합니다. "그냥 유니코드" 즉 UTF-16 LE 로 저장하면 안 됩니다.


이엠에디터(EmEditor)를 사용해 변환


풀다운 메뉴의
        File/
        Save As(다른 이름으로 저장)/
에서 나온 대화상자에서

Encoding(인코딩)을 UTF-16LE 나 UTF-8 로 지정한 후 "저장" 버튼을 누릅니다.


(윈도우에 기본으로 설치되어 있는) 메모장을 사용해 변환


풀다운 메뉴의
        파일/
        다른 이름으로 저장/
에서 나온 대화상자에서

"인코딩"을 "유니코드"나 "UTF-8"로 지정합니다. 특별한 이유가 없는 이상, "유니코드 (big endian)"은 선택하지 마세요. big endian 은 특수한 유니코드라서 거의 사용되지 않습니다.


울트라에디트(UltraEdit)를 사용해 변환:


풀다운 메뉴의
        File/
        Conversions(변환)/
에서

ASCII To Unicode : 현재 아스키 문서를 유니코드로 변환

ASCII To UTF-8 (Unicode Editing) : 현재 아스키 문서를 유니코드(UTF-8)로 변환



일반 아스키 텍스트 파일을 유니코드로 변환할 때에는 또는 그 반대로 변환할 때에는, 이엠에디터(EmEditor)로 변환하는 것이 가장 안정적입니다. 울트라에디터의 경우에는 버그가 있어서 한글 글자들이 깨지는 경우가 많습니다.
윈도우의 메모장도 전문적인 편집기가 아니라서 개행문자가 깨진다든지 문제가 많습니다.



▶▶ 유니코드(Unicode)를 ks_c_5601-1987, euc-kr, 한글 완성형으로 변환

▶▶ 일반 유니코드(Unicode)와 'UTF-8 유니코드'의 차이점

▶▶ [QnA] 유니코드 (Unicode) 의 BOM (Byte Order Mark) 이란?



에디터가 아닌 펄(프로그래밍 언어)로 변환하는 방법: ▶▶ 펄,Perl] 한글 완성형(euc-kr)파일, 유니코드(UTF-8)로 변환 저장, Convert Unicode




한글(.HWP)파일을 유니코드 텍스트 파일로 저장하기:


만약 한글 아스키 텍스트 파일(.TXT)이 아니라
아래아 한글 워드프로세서(.HWP) 파일을 유니코드 파일로 변환하려면

파일 > 다른 이름으로 저장하기
대화상자에서 텍스트 문서 (*.txt) 를 선택하고
[저장] 버튼 누른 후

"텍스트 문서 종류" 대화상자에서
유니코드나 유니코드(UTF-8)을 선택합니다.




tag: editor
텍스트 에디터 | 문서 편집기 | Text Editor

0 Comments:

Post a Comment

<< Home RSS 2.0 feed

구글 Google 에서 제공하는 무료 블로그 서비스인 블로거 Blogger 의 인터넷 주소는 www.blogger.com 입니다. Blogger 에 블로그를 만들면, blogspot.com 이라는 주소에 블로그가 생성됩니다.
블로그를 직접 방문하지 않고도 최신 게시물을 구독하려면 RSS 2.0 feed 주소를 리더기에 등록하시면 됩니다.
Previous Posts
Monthly Archives
Top