컴퓨터 엑셀 워드 포토숍 구글어스 WINDOWS JAVASCRIPT JAVA C++

 
Previous Post Python/파이썬] 문자열 길이 구하기 함수/유니코드 문자열 글자 수; Get Strin...CJK 란? CJK 글꼴(Font) 다운로드는? 한중일 삼국 글꼴이 하나로 된 폰트적외선 사진 (컬러, 흑백) 많은 곳, 갤러리; Color / BW Infrared Pho...롤라이플렉스(Rolleiflex) 디카 출시; 2안 렌즈 카메라; 미니 롤라이프렉스 Rol...일본 니콘, 캐논 디카 홈페이지; 렌즈 색감; NIKON CANON JapanPython/파이썬] 리스트(배열) 요소 추가/삽입, 삭제/제거; List (Array) ...Python/파이썬] 리스트(배열)를 문자열로 합치기, 변환; Join List (Arra...포토샵] 머리카락 추출하기, 털 윤곽선 따내기 방법: Hair Fur Extract Pho...포토샵] 컬러 적외선 사진 효과 필터 사용법 예제: Pseudo Infrared Photo...Python/파이썬] 변수, 문자열 출력/프린트 방법; Print String, Numbe...

Python/파이썬] 아스키 문자열을 유니코드 문자열로 변환 함수; ASCII String to Unicode String

Saturday, December 23, 2006

unicode() 라는 함수를 사용하면 아스키 문자열을 유니코드 문자열로 변환할 수 있습니다.

unicode(변환할 아스키 문자열, 아스키 문자열의 인코딩)

형식입니다. "똠방각하" 등을 표현할 수 있는 "한글 확장 완성형"의 인코딩은 949 입니다. 따라서 뒤쪽 인수를 "949" 라고 문자열로서 적어주면 됩니다. 또는 "cp949" 또는 "ms949" 라고 지정해도 됩니다.


아스키 문자열을, 유니코드 문자열로 변환 예제
#!/usr/bin/python
# -*- coding: 949 -*-


s = "안녕ABC"
print len(s)
# 글자 개수 출력 결과: 7
# 유니코드가 아닌 아스키 문자열이기에
# 한글은 2바이트로 간주




# 유니코드 문자열로 변환
s = unicode(s, "949")

print s
# 출력 결과: 안녕ABC

print len(s)
# 글자 개수 출력 결과: 5
# 유니코드 문자열이기에, 한글/영문 관계 없이 항상 1글자로 취급




문자열 상수, 즉 리터럴을 표현할 때에는

u"안녕ABC"

이렇게 앞에 u 라는 접두사를 붙이면 됩니다.


▶▶ Python/파이썬] 문자열 길이 구하기 함수/유니코드 문자열 글자 수; Get String Length, Unicode Size

☞ Python (파이썬)

0 Comments:

Post a Comment

<< Home RSS 2.0 feed

구글 Google 에서 제공하는 무료 블로그 서비스인 블로거 Blogger 의 인터넷 주소는 www.blogger.com 입니다. Blogger 에 블로그를 만들면, blogspot.com 이라는 주소에 블로그가 생성됩니다.
블로그를 직접 방문하지 않고도 최신 게시물을 구독하려면 RSS 2.0 feed 주소를 리더기에 등록하시면 됩니다.
Categories
Previous Posts
Monthly Archives
Top