Saturday, December 23, 2006
Python/파이썬] 문자열 길이 구하기 함수/유니코드 문자열 글자 수; Get String Length, Unicode Size
파이썬에서는 len() 이라는 내장 함수로 문자열의 길이를 "바이트 단위"로 구할 수 있습니다.
영문이나 기호 등의 1바이트 문자 1개는 1바이트로,
한글 같은 2바이트 문자 1개는 2바이트로 나타납니다.
영문은 괜찮지만, 한글이나 한글이 섞인 문자열에서는 len 함수로 글자 개수를 구할 수 없는데, 바이트 수가 아닌, 글자수를 구하기 위해서는 그 문자열 앞에 u 라는 접두사를 붙여 유니코드로 표현하면 됩니다. 또는 다음과 같이 유니코드로 변환하면 됩니다: ▶▶ Python/파이썬] 아스키 문자열을 유니코드 문자열로 변환 함수; ASCII String to Unicode String
문자열 길이, 유니코드 글자 개수 구하기 예제
▶▶ Python/파이썬] 리스트(배열) 크기 사이즈 구하기; List (Array) Size, Length
영문이나 기호 등의 1바이트 문자 1개는 1바이트로,
한글 같은 2바이트 문자 1개는 2바이트로 나타납니다.
영문은 괜찮지만, 한글이나 한글이 섞인 문자열에서는 len 함수로 글자 개수를 구할 수 없는데, 바이트 수가 아닌, 글자수를 구하기 위해서는 그 문자열 앞에 u 라는 접두사를 붙여 유니코드로 표현하면 됩니다. 또는 다음과 같이 유니코드로 변환하면 됩니다: ▶▶ Python/파이썬] 아스키 문자열을 유니코드 문자열로 변환 함수; ASCII String to Unicode String
문자열 길이, 유니코드 글자 개수 구하기 예제
#!/usr/bin/python
# -*- coding: 949 -*-
s = "ABCD"
print len(s)
# 출력 결과: 4
s = "안녕하세요"
print len(s)
# 출력 결과: 10
# 한글 1자는 2바이트
s = "안녕ABC"
print len(s)
# 출력 결과: 7
# 영문 1자는 1바이트
s = u"안녕ABC"
print len(s)
# 출력 결과: 5
# 유니코드 문자열은, 한글/영문 관계 없이 항상 1글자로 취급
# -*- coding: 949 -*-
s = "ABCD"
print len(s)
# 출력 결과: 4
s = "안녕하세요"
print len(s)
# 출력 결과: 10
# 한글 1자는 2바이트
s = "안녕ABC"
print len(s)
# 출력 결과: 7
# 영문 1자는 1바이트
s = u"안녕ABC"
print len(s)
# 출력 결과: 5
# 유니코드 문자열은, 한글/영문 관계 없이 항상 1글자로 취급
▶▶ Python/파이썬] 리스트(배열) 크기 사이즈 구하기; List (Array) Size, Length
tag: python
Python | 파이썬
<< Home