mwultong Blog ... 프로그래밍 / 계산기

컴퓨터 엑셀 워드 포토샵 구글어스 WINDOWS JAVASCRIPT JAVA C++

 
Friday, November 03, 2006

cp949, MS949, euc-kr, ks_c_5601-1987, 한글 완성형 인코딩 차이점


다음의 인코딩은 모두 "한글 완성형"을 의미합니다.

* cp949
* MS949
* euc-kr
* ks_c_5601-1987

cp949 와 MS949 는 MS에서 만든 "한글 확장 완성형"이고, 그래서 "똠방각하" "전홥니다" 의 "똠"자나 "홥"자를 사용할 수 있습니다. MS윈도우에서 사용하는 기본 인코딩이 cp949 입니다. (물론 Windows 내부적으로는 유니코드 UTF-16LE 를 사용)

euc-kr 과 ks_c_5601-1987 은 그냥 "한글 완성형"이기에, 똠방각하 등을 쓸 수 없어야 하지만, 현재는 "확장 완성형"과 사실상 동일한 인코딩으로서 사용되므로 표현할 수 있습니다.

다만 Perl(펄)에서는 cp949 가 아닌 euc-kr 로 지정하면, 똠방각하가 나오지 않습니다: ▶▶ [펄 프로그래밍] Perl/Tk 에서, 한글 사용하기; 한글 인코딩



즉, 현재 모든 한글 인코딩은 확장 완성형입니다. (물론 한글 유니코드일 경우에는, 확장 완성형이나 그냥 완성형과는 호환되지 않습니다.)


한글 확장 완성형으로 HTML 파일을 만들 때에는 euc-kr 이라는 이름으로 인코딩을 지정하는 것이 표준입니다. ks_c_5601-1987 이것은 표준이 아닙니다.




MS949 is not supported by the current VM operation system
만약 자바(JAVA)에서 이런 에러가 난다면, 자바 버전이 오래되어서 그럴 수도 있을 것입니다. Sun 에서 제공하는 최신 버전 (1.5 이상)의 자바를 설치해 보시기 바랍니다. ▶▶ [Java] 자바 런타임과 JDK(개발도구; 컴파일러) 파일 다운로드하는 곳은? / 자바의 종류는? [QnA]






업데이트
자바(Java)에서, cp949 나 euc-kr 로 인코딩을 지정하면, "똠방각하" 등이 표현되지 않습니다. 즉 "그냥 완성형"인 것입니다.

따라서 자바에서 똠방각하 등을 제대로 표현하기 위해서는, MS949 인코딩 즉 "한글 확장 완성형"을 사용해야 합니다.

다만, Perl에서는 cp949 인코딩으로도 확장완성형이 출력됩니다.




tag: editor
텍스트 에디터 | 문서 편집기 | Text Editor

0 Comments:

<< Home RSS 2.0 feed

구글 Google 에서 제공하는 무료 블로그 서비스인 블로거 Blogger 의 인터넷 주소는 www.blogger.com 입니다. Blogger 에 블로그를 만들면, blogspot.com 이라는 주소에 블로그가 생성됩니다.
블로그를 직접 방문하지 않고도 최신 게시물을 구독하려면 RSS 2.0 feed 주소를 리더기에 등록하시면 됩니다.
Previous Posts
Monthly Archives
Top