컴퓨터 엑셀 워드 포토숍 구글어스 WINDOWS JAVASCRIPT JAVA C++

 
Previous Post Python/파이썬] 주석 기호, 주석문 표현, 블록 코멘트; Block Comment R...Excel/엑셀] 문자열 찾기(Find)/바꾸기, 동시에 모두 검색, 문자 한꺼번에 치환(...윈도우 메모장, 줄바꿈 문자(Newline) 종류, 개행문자(CR-LF)란? - Windo...엑셀/Excel] VBA매크로: 알파벳 A-Z 까지 무작위 랜덤 문자 출력; Random ...CMD 확장자 파일 만들기, CMD.EXE로, 파일(File) 만들기/저장(Save)하기VI-VIM-GVIM 편집기] Win32 용 빔 에디터 다운로드/사용법; Download ...울트라에디트/UltraEdit] 파일 삽입/합치기/병합; 파일 끼워 넣기/붙이기 방법; I...VI-VIM-GVIM] 파일 삽입/합치기/병합; 파일 끼워 넣기/붙이기 방법(명령어); I...울트라에디트(UltraEdit) 사용 방법 설명서, 매뉴얼, 팁, UltraeditorC언어] C에서 제곱근, 루트 근사값 계산 방법, sqrt() 함수 사용법

Perl/펄] 문자열 길이, 사이즈(글자 수/바이트 수) 구하기; String Length, Size

Thursday, January 04, 2007

length() 라는 함수로 문자열의 길이를 구할 수 있습니다. 영문 문자열은 글자수와 바이트 수가 일치하지만, 한글은 2바이트 문자이기에, 글자수의 2배로 나옵니다.


문자열 길이 구하기 예제


#!/usr/bin/perl
use strict; use warnings;


my $s = "ABCD";
print length($s), "\n";
# 출력 결과: 4


$s = "FOO";
print length($s), "\n";
# 출력 결과: 3


$s = "똠방각하";
print length($s), "\n";
# 출력 결과: 8



위의 소스를 한글 완성형으로 저장하면 "똠방각하"가 8바이트로 나오지만,

만약 UTF-8 로 저장하면, 12바이트로 나옵니다.

UTF-8에서 한글 1글자는 3바이트이기에 그렇습니다.

이때는 소스에

use utf8;

이런 줄을 추가하면 "똠방각하"의 글자수인 4 가 정확히 나옵니다.



▶▶ Perl/펄] 한글 글자 개수, 바이트 수 (UTF-8 유니코드 문자열) 구하기; Unicode Hangul Byte

☞ Perl(펄)

0 Comments:

Post a Comment

<< Home RSS 2.0 feed

구글 Google 에서 제공하는 무료 블로그 서비스인 블로거 Blogger 의 인터넷 주소는 www.blogger.com 입니다. Blogger 에 블로그를 만들면, blogspot.com 이라는 주소에 블로그가 생성됩니다.
블로그를 직접 방문하지 않고도 최신 게시물을 구독하려면 RSS 2.0 feed 주소를 리더기에 등록하시면 됩니다.
Categories
Previous Posts
Monthly Archives
Top