数据类型介绍
数据的类型决定了数据在内存中占用的空间和存储的方式。 如int占4字节,char占1字节,float占4字节。类型不同,所占空间就不同。 将数据分为几大类:
整形家族:
char
unsigned char
signed char
short
unsigned short [int]
signed short [int]
int
unsigned int
signed int
long
unsigned long [int]
signed long [int]
以上类型未指定有无符号,则默认为有符号类型,char类型也归为整形是因为字符在char中是以ASCII码的形式存储的,ASCII码值是十进制整数0~127,所以char也算作整形家族。
浮点数家族:
float
double
构造类型:
> 数组类型
> 结构体类型 struct
> 枚举类型 enum
> 联合类型 union
指针类型:
int* pi;
char* pc;
float* pf;
void* pv;
空类型:
void 表示空类型(无类型)
通常应用于函数的返回类型、函数的参数、指针类型
数据的存储方式
在了解数据存储方式之前,先了解一下原码,反码,补码的概念 计算机中的整数有三种表示方法,即原码、反码和补码。 三种表示方法均有符号位和数值位两部分,符号位都是用0表示“正”,用1表示“负”,而数值位负整数的三种表示方法各不相同。 原码:直接将二进制按照正负数的形式翻译成二进制就可以。 反码:将原码的符号位不变,其他位依次按位取反就可以得到了。 补码:反码+1就得到补码。 正数的原、反、补码都相同。 以int类型的-10举例 对于整形来说:数据存放内存中其实存放的是补码。 为什么要这么麻烦存储补码呢? 在计算机系统中,数值一律用补码来表示和存储。原因在于,使用补码,可以将符号位和数值域统一处理;同时,加法和减法也可以统一处理(CPU只有加法器)此外,补码与原码相互转换,其运算过程是相同的,不需要额外的硬件电路。
我们看看在内存中的存储 我们可以看到对于a和b分别存储的是补码。但是我们发现顺序有点不对劲。 这是又为什么?
大小端介绍
大端(存储)模式,是指数据的低位保存在内存的高地址中,而数据的高位,保存在内存的低地址中; 小端(存储)模式,是指数据的低位保存在内存的低地址中,而数据的高位,保存在内存的高地址中。 例如:一个16bit的short型x,在内存中的地址为0x0010,x的值为0x1122,那么0x11为高字节,0x22为低字节。对于大端模式,就将0x11放在低地址中,即0x0010中,0x22 放在高地址中,即0x0011中。小端模式,刚好相反。我们常用的X86结构是小端模式,而KEILC51则为大端模式。很多的ARM,DSP都为小端模式。有些ARM处理器还可以由硬件来选择是大端模式还是小端模式。(注:0x代表后面的数字是16进制数)
有符号数与无符号数
此处介绍有符号数与无符号数以范围较小的char做例子
unsigned char
signed char(char默认为signed char)
char类型的大小为1字节,也就是8位。0000 0000~1111 1111是char的范围。
对于有符号数,signed char,8位中一位符号位,7位数字位。 0000 0000……0111 1111,非负整数0~127,共128个数 1000 0000……1111 1111,负整数-128~-1,共128个数,均为补码 注意,1000 0000是-128的补码, -128原码1 1000 0000,只有8位来存储发生截断,实际存储只存储1000 0000 反码0111 1111, 补码1000 0000 因为char只有8位,将1 1000 0000截断为1000 0000 对于无符号数,unsigned char,没有符号位,8位数字位。 0000 0000~1111 1111,就是0~255。也是一共256个数字。
整形提升以及几个例子
看下面一段代码
#include <stdio.h>
int main()
{
char a = -1;
signed char b = -1;
unsigned char c = -1;
printf("a=%d,b=%d,c=%d", a, b, c);
return 0;
}
a和b赋的值都是在取值范围内的,c赋的值已超出无符号数的范围。 前两个结果都是-1。 打印的时候用的是%d,意为打印有符号整形,32位也就是4字节的数据,但是char只有8字节,怎么解决不匹配的问题呢。对char进行整形提升。将8位的char提升为32位的整形数据。整形提升时,若是有符号数,则在前添符号位;若是无符号数,则添0。此处-1是有符号数,故添1。 -1 原码:1000 0001反码:1111 1110 补码:1111 1111, 整形提升后的补码:1111 1111 1111 1111 1111 1111 1111 1111 在此基础上转回原码:1000 0000 0000 0000 0000 0000 0000 0001 表示的仍是-1, 我们着重看c。它的结果不是-1,而是255,为什么呢 我们看一下-1的补码,1111 1111,整形提升后的补码 0000 0000 0000 0000 0000 0000 1111 1111(因为unsigned char无符号,提升时添加0) 原码0000 0000 0000 0000 0000 0000 1111 1111就是255
再看一段代码
#include <stdio.h>
int main()
{
char a = -128;
printf("%u\n", a);
return 0;
}
这是将范围内的数据赋值给char。 那这次的结果又如何呢,结果是4294967168,一个非常大的数字。 为什么会出现如此巨大的数字呢? 这是因为%u是打印无符号整形,所以char要进行整形提升 -128补码1000 0000 整形提升后(负数添1) 1111 1111 1111 1111 1111 1111 1000 0000这就是上面那个巨大的数字 再举一个特殊例子
#include <stdio.h>
int main()
{
char a = 128;
printf("%u\n", a);
return 0;
}
注意char的取值范围-128~127。此处128已经超过char的范围了,和上面-1的例子有些相像。 同样我们来分析它的补码:补码就是原码0 1000 0000因为只存储8位, 实际补码就是截断后的原码1000 0000,和-128的补码一致,所以打印出来的和上一个例子一样4294967168 也就是说将一个变量赋一个取值范围之外的值是不稳定的,容易产生意料之外的结果,因此在使用变量时,一定要多加注意。
|