Thursday, October 26, 2006
유니코드(Unicode), 아스키(ASCII; 한글완성형) 차이/차이점; Unicode ASCII Difference
유니코드(Unicode)이든 아스키(ASCII) 텍스트든, 모두 파일에 글자들을 표현하는 방식입니다.
* 현재 사용되는 아스키(ASCII) 코드의 더 정확한 이름은 ANSI Code 입니다. (색깔을 나타내는 앤시 코드가 아니고 문자를 나타내는 규약입니다.)
* 영문/숫자 1글자는 1바이트, 한글/한자 1글자는 2바이트입니다.
* 하나의 인코딩당, 영문과 또다른 하나의 언어만 사용할 수 있습니다. 한국어 아스키 코드인 완성형(euc-kr) 인코딩에서는 영문과 한글 그리고 한국에서 사용되는 한자만 표현할 수 있습니다. 물론 일본어 가나도 섞여 있지만, 일본어 인코딩이 아니기에 일본인은 읽을 수 없습니다.
그래서 하나의 파일에 여러 언어를 동시에 표현하기 힘들거나 불가능합니다.
* 컴퓨터 초창기부터 사용되어 왔기에, 호환성이 아주 좋습니다.
* MS윈도우2000/XP이상의 운영체제에서는, 내부적으로 유니코드를 사용하지만, 사용자가 실제 읽고 쓰는 텍스트 문서는 대부분 아스키 코드입니다.
* 영문/숫자/한글/한자 등 모든 글자는 이론적으로 2바이트입니다. 그리고 파일에 저장될 때도 2바이트로 저장됩니다.
아주 희귀한 문자들은 2바이트를 초과할 수도 있습니다.
단, UTF-8 유니코드가 파일에 저장될 때, 영문/숫자는 아스키 코드와 똑같이 1바이트를 사용하고, 한글 등은 3바이트로 파일에 저장됩니다. UTF-8 유니코드는 아스키 코드와 영문 영역에서는 100% 호환됩니다. 만약 UTF-8 유니코드 문서에 한글 등이 전혀 없고, 영문과 숫자로만 이루어져 있다면, 그 파일은 아스키 코드와 동일합니다.
웹페이지를 유니코드로 만들 때에는 UTF-8 유니코드를 사용합니다.
* 전세계의 모든 언어를 하나의 파일에 쓸 수 있습니다. 물론 각 언어에 해당하는 폰트가 설치되어 있어야 합니다.
* 유니코드의 역사가 그리 오래되지 않아서, 아직도 유니코드를 잘 인식하지 못하는 컴퓨터가 있습니다. 특히 윈도우98이나 오래된 유닉스 시스템의 경우입니다. 그렇지만 유니코드로 작성된 인터넷 웹페이지는 대부분 잘 인식합니다. (업데이트 2021-11-01: 요즘의 웹페이지들은 대부분 유니코드 UTF-8 로 작성됩니다.)
참고로, 저의 이 블로그(https://mwultong.blogspot.com/)도, 유니코드(UTF-8)로 되어 있습니다.
참고: ▶▶ 일반 유니코드(Unicode)와 'UTF-8 유니코드'의 차이
아스키(ASCII) 텍스트 / 한글 KS완성형(euc-kr)
* 현재 사용되는 아스키(ASCII) 코드의 더 정확한 이름은 ANSI Code 입니다. (색깔을 나타내는 앤시 코드가 아니고 문자를 나타내는 규약입니다.)
* 영문/숫자 1글자는 1바이트, 한글/한자 1글자는 2바이트입니다.
* 하나의 인코딩당, 영문과 또다른 하나의 언어만 사용할 수 있습니다. 한국어 아스키 코드인 완성형(euc-kr) 인코딩에서는 영문과 한글 그리고 한국에서 사용되는 한자만 표현할 수 있습니다. 물론 일본어 가나도 섞여 있지만, 일본어 인코딩이 아니기에 일본인은 읽을 수 없습니다.
그래서 하나의 파일에 여러 언어를 동시에 표현하기 힘들거나 불가능합니다.
* 컴퓨터 초창기부터 사용되어 왔기에, 호환성이 아주 좋습니다.
* MS윈도우2000/XP이상의 운영체제에서는, 내부적으로 유니코드를 사용하지만, 사용자가 실제 읽고 쓰는 텍스트 문서는 대부분 아스키 코드입니다.
유니코드(Unicode / UTF-8) 텍스트
* 영문/숫자/한글/한자 등 모든 글자는 이론적으로 2바이트입니다. 그리고 파일에 저장될 때도 2바이트로 저장됩니다.
아주 희귀한 문자들은 2바이트를 초과할 수도 있습니다.
단, UTF-8 유니코드가 파일에 저장될 때, 영문/숫자는 아스키 코드와 똑같이 1바이트를 사용하고, 한글 등은 3바이트로 파일에 저장됩니다. UTF-8 유니코드는 아스키 코드와 영문 영역에서는 100% 호환됩니다. 만약 UTF-8 유니코드 문서에 한글 등이 전혀 없고, 영문과 숫자로만 이루어져 있다면, 그 파일은 아스키 코드와 동일합니다.
웹페이지를 유니코드로 만들 때에는 UTF-8 유니코드를 사용합니다.
* 전세계의 모든 언어를 하나의 파일에 쓸 수 있습니다. 물론 각 언어에 해당하는 폰트가 설치되어 있어야 합니다.
* 유니코드의 역사가 그리 오래되지 않아서, 아직도 유니코드를 잘 인식하지 못하는 컴퓨터가 있습니다. 특히 윈도우98이나 오래된 유닉스 시스템의 경우입니다. 그렇지만 유니코드로 작성된 인터넷 웹페이지는 대부분 잘 인식합니다. (업데이트 2021-11-01: 요즘의 웹페이지들은 대부분 유니코드 UTF-8 로 작성됩니다.)
참고로, 저의 이 블로그(https://mwultong.blogspot.com/)도, 유니코드(UTF-8)로 되어 있습니다.
참고: ▶▶ 일반 유니코드(Unicode)와 'UTF-8 유니코드'의 차이
tag: editor
텍스트 에디터 | 문서 편집기 | Text Editor
tag: html
HTML | CSS | 자바스크립트 JavaScript
<< Home