컴퓨터 엑셀 워드 포토샵 구글어스 WINDOWS JAVASCRIPT JAVA C++

 
Tuesday, July 18, 2006

유니코드, 완성형, 확장완성형, 조합형의 차이점, 한글 코드 차이


각 한글 코드들을, 역사가 오래된 순서대로 나열하면 이렇습니다:

조합형
완성형
확장완성형
유니코드


조합형 한글


한글 자모 (ㄱㄴㄷㄹ ㅏㅑㅓㅕ...) 들을 즉석에서 조합해서, 한글을 표현합니다. 한글 표현에 있어 가장 합리적이고 이상적인 방식이라서 도스 시절에는 많이 사용되었지만, 지금의 윈도우 환경에서는 사실상 전혀 쓰이지 않고, 윈도의 메모장 등에서는 아예 보이지도 않습니다. 조합형 한글 문서 파일은 "아래아한글(HWP)" 워드프로세서에서 읽거나 변환할 수 있습니다. 11172자의 모든 한글을 표현 가능합니다.




완성형 한글


한글 글쓰기에서 많이 사용되는 글자들만 골라서, "가" "나" "다" "라" 이렇게 미리 만들어 놓고 한 덩어리로 표현하는 코드입니다. 그래서 자모를 다시 분리할 수 없습니다.

한글 글자가 고작 2350자 있고,
한자 4888자, 그 외에 각종 기호와 외국 글자들이 조금 들어 있습니다.

모든 한글 음절을 표현할 수는 없어서 "똠방각하"의 "똠"자나, "전홥니다"의 "홥"자 등은 쓰지 못하는 심각한 문제가 있습니다. 한글도스와 윈도95에서 사용되었습니다.




확장 완성형 한글


기존의 완성형 코드의 빈 공간 여기저기에, "똠", "홥" 등의 글자를 억지로 추가해 넣은 것입니다. 그래서 글자들이 순서대로 정리되어 있지 않다는 심각한 문제가 있습니다. 윈도우98에서부터 사용되었고, 요즘의 윈도우XP에서도 내부적으로는 유니코드를 사용하지만 외부적으로는 여전히 확장 완성형이 사용됩니다.




유니코드


한글뿐 아니라, 전세계의 모든 글자들을 한꺼번에 표현하는 코드입니다. 유니코드도 일종의 완성형입니다. 그러나 "똠", "홥" 등의 모든 한글 음절을 표기할 수 있고, 게다가 한글 글자들이 순서대로 가지런히 정렬되어 있습니다. (유니코드는 엄밀히 말해서 한글 코드가 아니고 "전세계 문자 코드"이지만, 한글이 완벽히 표현되기에 여기서는 한글 코드의 한 종류로 취급했습니다.) 조합형과 마찬가지로 11172자의 모든 현대 한글 글자를 표현할 수 있습니다.




※ 문서가 확장완성형이나 유니코드라도, 폰트(글꼴) 속에 '똠'이나 '홥'자가 없다면, 표현이 잘 되지 않거나 보이지 않게 됩니다. 윈도의 기본 글꼴 속에는 '똠'이나 '홥' 등이 들어 있지만, 크기가 작은 폰트나 특히 웹폰트의 경우에는 자주 쓰이는 글자들만 있습니다.

※ "완성형"을 제외하고는 모든 종류의 한글 코드에서 "똠방각하" 등을 표현할 수 있음.
※ 윈도2000/XP 이상의 운영체제에서는, 시스템 내부적으로는 유니코드(UTF-16LE)를 사용함. 그러나 외부적으로는 여전히 "확장 완성형"을 사용함. 다만 프로그램에 따라 유니코드를 사용할 수도 있고 아닐 수도 있음.




▶▶ [아래아한글(HWP)] '조합형' 텍스트 파일을, '완성형' 문서로 변환하기 - 한국(KSSM) to 한국(KS)

▶▶ [Perl/펄] 한글 자소 처리: '똠방각하'를 'ㄸㅗㅁㅂㅏㅇㄱㅏㄱㅎㅏ'로 자동 변환


0 Comments:

Post a Comment

<< Home RSS 2.0 feed

구글 Google 에서 제공하는 무료 블로그 서비스인 블로거 Blogger 의 인터넷 주소는 www.blogger.com 입니다. Blogger 에 블로그를 만들면, blogspot.com 이라는 주소에 블로그가 생성됩니다.
블로그를 직접 방문하지 않고도 최신 게시물을 구독하려면 RSS 2.0 feed 주소를 리더기에 등록하시면 됩니다.
Previous Posts
Monthly Archives
Top