컴퓨터 엑셀 워드 포토샵 구글어스 WINDOWS JAVASCRIPT JAVA C++

 
Friday, September 29, 2006

C언어,비트연산] 바이트 순서 바꾸기 함수, short의 byte 위치를 Byte Swap


한글이나 유니코드 글자는 "unsigned short" 즉 "부호 없는 16비트 정수"로 메모리에 저장됩니다. 즉 바이트 2개로 이루어져 있습니다. 그런데 인텔 CPU는 리틀 엔디언 (little-endian) 이기에, 이 2바이트의 순서를 바꾸어서 저장합니다. 따라서 제대로 된 글자를 얻으려면 바이트의 순서를 다시 바꾸어서 출력해야 합니다.

비트연산을 이용하여 "unsigned short" 의 바이트 순서를 뒤바꾸는 함수가, 여기서 소개하는 byteSwap() 입니다.


바이트 순서 변경 예제


파일명: 0.cpp
#include <stdio.h>

unsigned short byteSwap(unsigned short n);


void main(void) {

  char s[] = "가"; // 한글 완성형에서 "가"는 0xB0A1 이지만, 메모리에는 0xA1B0 로 저장됨

  unsigned short char16 = *((unsigned short *)s);

  printf("(메모리에 저장된 순서) 0x%04X, (뒤바꾼 순서) 0x%04X\n", char16, byteSwap(char16));
}



unsigned short byteSwap(unsigned short n) {
  return ((n >> 8) | (n << 8));
}


실행 결과:
(메모리에 저장된 순서) 0xA1B0, (뒤바꾼 순서) 0xB0A1




함수 설명


(편의상, 16비트 2진수를 8비트씩 나누어 표기했음)

10100001 10110000 (= 0xA1B0) 에서

첫번째 바이트를 (n >> 8) 이렇게 우측으로 8비트를 밀면
00000000 10100001
이렇게 되고

또한 (n << 8) 이렇게 두번째 바이트를 좌측으로 8비트 밀어서
10110000 00000000
이렇게 만든 후

| (OR) 연산자는 대응되는 비트가 모두 0일 때는 0이 되고, 그렇지 않을 때는 변동이 없으므로

00000000 10100001
10110000 00000000
-----------------
10110000 10100001

결국 이렇게 2쌍의 바이트의 순서가 뒤집어짐.



▶▶ C언어,비트연산] unsigned short 에서 좌측 바이트, 우측 바이트만 얻기 - Left Byte, Right Byte

▶▶ '리틀 엔디언 little-endian 유니코드'와 '빅 엔디언 big-endian 유니코드'의 차이점




tag: cpp
C언어 | C/C++ (Visual C++)

0 Comments:

Post a Comment

<< Home RSS 2.0 feed

구글 Google 에서 제공하는 무료 블로그 서비스인 블로거 Blogger 의 인터넷 주소는 www.blogger.com 입니다. Blogger 에 블로그를 만들면, blogspot.com 이라는 주소에 블로그가 생성됩니다.
블로그를 직접 방문하지 않고도 최신 게시물을 구독하려면 RSS 2.0 feed 주소를 리더기에 등록하시면 됩니다.
Previous Posts
Monthly Archives
Top