问题引出
C语言中,在需要用到16进制数据的时候,可以通过printf
函数的%x
格式打印数据的16进制形式。在某些位标记、位操作的场合,需要用到2进制格式的数据,但printf
函数不能输出2进制格式,虽然可以通过使用itoa
或_itoa
的方法转为2进制的字符串打印,但显示的长度是不固定的,无法显示有效数位前面的0。
例如:现在需要打印数字258的2进制格式,且需要将32位全部显示出来,即想要得到结果00000000 00000000 00000001 00000010
,而使用_itoa
的方法和打印结果为:
int a = 258;
char s[32];
_itoa(a, s, 2);
printf("a --> %s\n", s);
a --> 100000010
不是我们想要的格式!
数据存储原理探析
那要怎么办呢?自己写个小程序吧,思路如下:
首先弄清楚数据在计算机中是如何存储的,对应int型数字,在32或64位计算机中都占4个字节,而计算机中的数据存储是以字节(Byte)为单位,1个字节包含8个位(bit),例如,数字258的16进制形式为0x00000102
,2进制形式为:00000000 00000000 00000001 00000010
,其在计算机内存中的存储方式如图所示:
右侧的16进制数是内存的地址,向上递增,方框里的二进制数是内存单元实际存储的字节内存,我们可以通过程序测试验证一下,因为unsigned char或char类型在系统是占用一个字节,因此可以定义该变量的指针,分别指向int的4个字节,打印其内存地址和实际存储的内存进行验证,代码如下:
int a = 258;
//使用unsigned char来验证int的每一个字节
unsigned char *p1 = (unsigned char*)&a; //获取a的首地址
unsigned char *p2 = (unsigned char*)&a+1; //获取a的首地址的后一个字节地址
unsigned char *p3 = (unsigned char*)&a+2; //获取a的首地址的后两个字节地址
unsigned char *p4 = (unsigned char*)&a+3; //获取a的首地址的后三个字节地址
printf("[a] p1:%x, %d\r\n", p1, *p1); //打印p1的地址与存储的字节内容
printf("[a] p2:%x, %d\r\n", p2, *p2); //打印p2的地址与存储的字节内容
printf("[a] p3:%x, %d\r\n", p3, *p3); //打印p3的地址与存储的字节内容
printf("[a] p4:%x, %d\r\n", p4, *p4); //打印p4的地址与存储的字节内容
运行结果:
[a] p1:5216f804, 2
[a] p2:5216f805, 1
[a] p3:5216f806, 0
[a] p4:5216f807, 0
可以看出,随着地址的增加,存储的内存依次是2、1、0、0,对应数字258的从底到高的4个字节的值,另外每次运行程序,变量a的地址是自动分配的,所以每次的输出与上面示意图的地址是不同的,但都是4个连续增加的地址值。
另外补充一下,这是一种小端字节序的存储方法,即将一个数据的低字节存储在内存的低地址,或理解为先存储数据的低字节。与之对应的是大端字节序存储方式,即先存储数据的高位字节,类似与我们书写数字时从左到右先写高位数字一样。由于计算机先处理地位字节的效率比较高,因此计算机内部的数据处理均采用小端字节序,而为了方便人的阅读,除了计算机内部处理,其它场合是采用大端字节序的。可通过下面的示意图助记:
另外,需要区分一点,无论大端还小端字节序,在一个字节的内部的8位2进制数,都是按照人类的习惯从左到右存放,如00000010
在字节中也是按照这样存储的,不需要反过来。
C代码实现
分析了这么多,可以编写代码来输出一个数字的2进制格式形式了。具体的代码实现:
void printf_bin(int num)
{
int i, j, k;
unsigned char *p = (unsigned char*)&num + 3;//p先指向num后面第3个字节的地址,即num的最高位字节地址
for (i = 0; i < 4; i++) //依次处理4个字节(32位)
{
j = *(p - i); //取每个字节的首地址,从高位字节到低位字节,即p p-1 p-2 p-3地址处
for (int k = 7; k >= 0; k--) //处理每个字节的8个位,注意字节内部的二进制数是按照人的习惯存储!
{
if (j & (1 << k))//1左移k位,与单前的字节内容j进行或运算,如k=7时,00000000&10000000=0 ->该字节的最高位为0
printf("1");
else
printf("0");
}
printf(" ");//每8位加个空格,方便查看
}
printf("\r\n");
}
数字258的实际运行效果:
00000000 00000000 00000001 00000010
对应unsigned char型的数字,如果只需要显示8位2进制数,可以对上述小程序简化:
void printf_bin_8(unsigned char num)
{
int k;
unsigned char *p = (unsigned char*)#
for (int k = 7; k >= 0; k--) //处理8个位
{
if (*p & (1 << k))
printf("1");
else
printf("0");
}
printf("\r\n");
}
数字12的运行效果
关于负数
上面测试的都是正数,当然,对于负数,也是可以显示的,因为负数在计算机中是以对应正数的补码来存储的,因而显示的2进制数也是补码形式,这里顺便再复习一下补码:
对于负数-9,对应的正数位9,9的原码,反码,补码如下:
这里只画出8位示意,int型数字实际是占32位,对应的高位全是0或1。
使用程序测试一下-9的2进制格式输出:
11111111 11111111 11111111 11110111
可以正确显示。
完整测试代码
下面是整个本文的整个测试程序:
#include <stdio.h>
#include <stdlib.h>
void printf_bin(int num)
{
int i, j, k;
unsigned char *p = (unsigned char*)&num + 3;
for (i = 0; i < 4; i++) //处理4个字节(32位)
{
j = *(p - i); //取每个字节的首地址
for (int k = 7; k >= 0; k--) //处理每个字节的8个位
{
if (j & (1 << k))
printf("1");
else
printf("0");
}
printf(" ");
}
printf("\r\n");
}
void printf_bin_8(unsigned char num)
{
int k;
unsigned char *p = (unsigned char*)#
for (int k = 7; k >= 0; k--) //处理8个位
{
if (*p & (1 << k))
printf("1");
else
printf("0");
}
printf("\r\n");
}
int main()
{
int a = 258;
int b = -9;
printf("定义int a=%d, int b=%d\r\n", a, b);
//使用unsigned char来验证int的每一个字节
unsigned char *p1 = (unsigned char*)&a; //获取a的首地址
unsigned char *p2 = (unsigned char*)&a+1;//获取a的首地址的后一个字节地址
unsigned char *p3 = (unsigned char*)&a+2;//获取a的首地址的后两个字节地址
unsigned char *p4 = (unsigned char*)&a+3;//获取a的首地址的后三个字节地址
printf("\r\n查看a的每个字节的地址与内容:\r\n");
printf("[a] p1:%x, %d\r\n", p1, *p1);//打印p1的地址与存储的字节内容
printf("[a] p2:%x, %d\r\n", p2, *p2);//打印p2的地址与存储的字节内容
printf("[a] p3:%x, %d\r\n", p3, *p3);//打印p3的地址与存储的字节内容
printf("[a] p4:%x, %d\r\n", p4, *p4);//打印p4的地址与存储的字节内容
p1 = (unsigned char*)&b;
p2 = (unsigned char*)&b + 1;
p3 = (unsigned char*)&b + 2;
p4 = (unsigned char*)&b + 3;
printf("\r\n查看b的每个字节的地址与内容:\r\n");
printf("[b] p1:%x, %d\r\n", p1, *p1);
printf("[b] p2:%x, %d\r\n", p2, *p2);
printf("[b] p3:%x, %d\r\n", p3, *p3);
printf("[b] p4:%x, %d\r\n", p4, *p4);
//自己的方法1
printf("\r\na的2进制格式(显示32位):\r\n");
printf_bin(a);
printf("\r\nb的2进制格式(显示32位):\r\n");
printf_bin(b);
//自己的方法2
unsigned char c = 12;
printf("\r\n定义unsigned char c=%d\r\n", c);
printf("c的2进制格式(显示8位):\r\n");
printf_bin_8(c);
//调用函数的方法
printf("\r\n使用_itoa函数显示2进制格式\r\n");
char s[32];
_itoa(a, s, 2);
printf("a --> %s\n", s);
_itoa(b, s, 2);
printf("b --> %s\n", s);
_itoa(c, s, 2);
printf("c --> %s\n", s);
getchar();
return 0;
}
运行结果:
定义int a=258, int b=-9
查看a的每个字节的地址与内容:
[a] p1:a739f4d4, 2
[a] p2:a739f4d5, 1
[a] p3:a739f4d6, 0
[a] p4:a739f4d7, 0
查看b的每个字节的地址与内容:
[b] p1:a739f4f4, 247
[b] p2:a739f4f5, 255
[b] p3:a739f4f6, 255
[b] p4:a739f4f7, 255
a的2进制格式(显示32位):
00000000 00000000 00000001 00000010
b的2进制格式(显示32位):
11111111 11111111 11111111 11110111
定义unsigned char c=12
c的2进制格式(显示8位):
00001100
使用_itoa函数显示2进制格式
a --> 100000010
b --> 11111111111111111111111111110111
c --> 1100