mwultong Blog ... 프로그래밍 / 계산기

컴퓨터 엑셀 워드 포토샵 구글어스 WINDOWS JAVASCRIPT JAVA C++

 
Thursday, January 04, 2007

Perl/펄] 문자열 길이, 사이즈(글자 수/바이트 수) 구하기; String Length, Size


length() 라는 함수로 문자열의 길이를 구할 수 있습니다. 영문 문자열은 글자수와 바이트 수가 일치하지만, 한글은 2바이트 문자이기에, 글자수의 2배로 나옵니다.

문자열 길이 구하기 예제 소스


#!/usr/bin/perl
use strict; use warnings;


my $s = "ABCD";
print length($s), "\n";
# 출력 결과: 4


$s = "FOO";
print length($s), "\n";
# 출력 결과: 3


$s = "똠방각하";
print length($s), "\n";
# 출력 결과: 8



위의 소스를 한글 완성형으로 저장하면 "똠방각하"가 8바이트로 나오지만,

만약 UTF-8 로 저장하면, 12바이트로 나옵니다.

UTF-8에서 한글 1글자는 3바이트이기에 그렇습니다.

이때는 소스에

use utf8;

이런 줄을 추가하면 "똠방각하"의 글자수인 4 가 정확히 나옵니다.



▶▶ Perl/펄] 한글 글자 개수, 바이트 수 (UTF-8 유니코드 문자열) 구하기; Unicode Hangul Byte




tag: perl
Perl | 펄

0 Comments:

<< Home RSS 2.0 feed

구글 Google 에서 제공하는 무료 블로그 서비스인 블로거 Blogger 의 인터넷 주소는 www.blogger.com 입니다. Blogger 에 블로그를 만들면, blogspot.com 이라는 주소에 블로그가 생성됩니다.
블로그를 직접 방문하지 않고도 최신 게시물을 구독하려면 RSS 2.0 feed 주소를 리더기에 등록하시면 됩니다.
Previous Posts
Monthly Archives
Top