컴퓨터 엑셀 워드 포토숍 구글어스 WINDOWS JAVASCRIPT JAVA C++

 
Previous Post Perl/펄] 달러;$ 골뱅이;@ 퍼센트;% 샤프;# 특수 기호 의미 사용법 예제Perl 펄] 배열 사이즈 구하기; 배열 크기/길이 얻는 함수; Array SizePerl/펄] 한글 글자 개수, 바이트 수 (UTF-8 유니코드 문자열) 구하기; Unic...Perl/펄] 문자열 길이, 사이즈(글자 수/바이트 수) 구하기; String Length...Python/파이썬] 주석 기호, 주석문 표현, 블록 코멘트; Block Comment R...Excel/엑셀] 문자열 찾기(Find)/바꾸기, 동시에 모두 검색, 문자 한꺼번에 치환(...윈도우 메모장, 줄바꿈 문자(Newline) 종류, 개행문자(CR-LF)란? - Windo...엑셀/Excel] VBA매크로: 알파벳 A-Z 까지 무작위 랜덤 문자 출력; Random ...CMD 확장자 파일 만들기, CMD.EXE로, 파일(File) 만들기/저장(Save)하기VI-VIM-GVIM 편집기] Win32 용 빔 에디터 다운로드/사용법; Download ...

Perl/펄] 한글 유니코드 코드 값(번호) 구하기 함수; Hangul Unicode Code Value

Thursday, January 04, 2007

특정 글자의 "유니코드 값"을 구하는 방법입니다. 유니코드 값이란, 유니코드 번호, 즉 "유니코드 코드 포인트(Code Point)"입니다. 1바이트(8비트)인 아스키 코드와 달리, 2바이트(16비트)입니다.

우선 울트라에디트 등의 편집기를 사용하여, 펄 소스 자체를 "UTF-8 유니코드"로 변환해 주어야 합니다.

그런 후 펄 소스에

use utf8;

이런 프라그마를 삽입합니다. 그러면 이제 유니코드 문자열을 펄 소스에 쓸 수 있고, 펄의 내장 함수들도 유니코드 모드로 작동합니다.

이렇게 해 주지 않으면, ord() 함수가, 유니코드 값이 아닌 그냥 아스키 코드 값을 출력합니다.

ord() 함수로, "유니코드 문자 번호" 알아내기 예제


(UTF-8 유니코드로 다음 예제 소스를 저장해야 함)
#!/usr/bin/perl
use strict; use warnings;

use utf8;


  my $s = "가";
  printf("%04X\n", ord($s));
  # 출력 결과: AC00

  printf("%04X\n", ord("天"));
  # 출력 결과: 5929

  printf("%04X\n", ord("Z"));
  # 출력 결과: 005A



한글 낱자 "가"의 유니코드 값은, 즉 유니코드 코드 번호는 16진수로 0xAC00 입니다.

한자 "天"의 유니코드 값은 0x5929 입니다.


1바이트 알파벳 Z 는, 유니코드에서도, 아스키 코드와 같은 값인 0x5A 가 나옵니다.



▶▶ 유니코드(UTF-8) 문자에 번호(Code Point) 붙이기 [펄/Perl]


아스키 유니코드, 16진법 2진법 10진수 상호 변환기: ▶▶ 16진수 헥사, 2진수, 10진수, 8진법 변환 계산기; Hex Calc


유니코드 | Unicode

0 Comments:

Post a Comment

<< Home RSS 2.0 feed

구글 Google 에서 제공하는 무료 블로그 서비스인 블로거 Blogger 의 인터넷 주소는 www.blogger.com 입니다. Blogger 에 블로그를 만들면, blogspot.com 이라는 주소에 블로그가 생성됩니다.
블로그를 직접 방문하지 않고도 최신 게시물을 구독하려면 RSS 2.0 feed 주소를 리더기에 등록하시면 됩니다.
Categories
Previous Posts
Monthly Archives
Top