Friday, September 29, 2006
C언어,비트연산] 바이트 순서 바꾸기 함수, short의 byte 위치를 Byte Swap
한글이나 유니코드 글자는 "unsigned short" 즉 "부호 없는 16비트 정수"로 메모리에 저장됩니다. 즉 바이트 2개로 이루어져 있습니다. 그런데 인텔 CPU는 리틀 엔디언 (little-endian) 이기에, 이 2바이트의 순서를 바꾸어서 저장합니다. 따라서 제대로 된 글자를 얻으려면 바이트의 순서를 다시 바꾸어서 출력해야 합니다.
비트연산을 이용하여 "unsigned short" 의 바이트 순서를 뒤바꾸는 함수가, 여기서 소개하는 byteSwap() 입니다.
파일명: 0.cpp
실행 결과:
(메모리에 저장된 순서) 0xA1B0, (뒤바꾼 순서) 0xB0A1
(편의상, 16비트 2진수를 8비트씩 나누어 표기했음)
10100001 10110000 (= 0xA1B0) 에서
첫번째 바이트를 (n >> 8) 이렇게 우측으로 8비트를 밀면
00000000 10100001
이렇게 되고
또한 (n << 8) 이렇게 두번째 바이트를 좌측으로 8비트 밀어서
10110000 00000000
이렇게 만든 후
| (OR) 연산자는 대응되는 비트가 모두 0일 때는 0이 되고, 그렇지 않을 때는 변동이 없으므로
00000000 10100001
10110000 00000000
-----------------
10110000 10100001
결국 이렇게 2쌍의 바이트의 순서가 뒤집어짐.
▶▶ C언어,비트연산] unsigned short 에서 좌측 바이트, 우측 바이트만 얻기 - Left Byte, Right Byte
▶▶ '리틀 엔디언 little-endian 유니코드'와 '빅 엔디언 big-endian 유니코드'의 차이점
비트연산을 이용하여 "unsigned short" 의 바이트 순서를 뒤바꾸는 함수가, 여기서 소개하는 byteSwap() 입니다.
바이트 순서 변경 예제
파일명: 0.cpp
#include <stdio.h>
unsigned short byteSwap(unsigned short n);
void main(void) {
char s[] = "가"; // 한글 완성형에서 "가"는 0xB0A1 이지만, 메모리에는 0xA1B0 로 저장됨
unsigned short char16 = *((unsigned short *)s);
printf("(메모리에 저장된 순서) 0x%04X, (뒤바꾼 순서) 0x%04X\n", char16, byteSwap(char16));
}
unsigned short byteSwap(unsigned short n) {
return ((n >> 8) | (n << 8));
}
unsigned short byteSwap(unsigned short n);
void main(void) {
char s[] = "가"; // 한글 완성형에서 "가"는 0xB0A1 이지만, 메모리에는 0xA1B0 로 저장됨
unsigned short char16 = *((unsigned short *)s);
printf("(메모리에 저장된 순서) 0x%04X, (뒤바꾼 순서) 0x%04X\n", char16, byteSwap(char16));
}
unsigned short byteSwap(unsigned short n) {
return ((n >> 8) | (n << 8));
}
실행 결과:
(메모리에 저장된 순서) 0xA1B0, (뒤바꾼 순서) 0xB0A1
함수 설명
(편의상, 16비트 2진수를 8비트씩 나누어 표기했음)
10100001 10110000 (= 0xA1B0) 에서
첫번째 바이트를 (n >> 8) 이렇게 우측으로 8비트를 밀면
00000000 10100001
이렇게 되고
또한 (n << 8) 이렇게 두번째 바이트를 좌측으로 8비트 밀어서
10110000 00000000
이렇게 만든 후
| (OR) 연산자는 대응되는 비트가 모두 0일 때는 0이 되고, 그렇지 않을 때는 변동이 없으므로
00000000 10100001
10110000 00000000
-----------------
10110000 10100001
결국 이렇게 2쌍의 바이트의 순서가 뒤집어짐.
▶▶ C언어,비트연산] unsigned short 에서 좌측 바이트, 우측 바이트만 얻기 - Left Byte, Right Byte
▶▶ '리틀 엔디언 little-endian 유니코드'와 '빅 엔디언 big-endian 유니코드'의 차이점
tag: cpp
C언어 | C/C++ (Visual C++)
<< Home