基本概念
CPU一次能读取多少个字节的数据主要是看数据总线是多少位的,16位CPU一次能读取2个字节,32位CPU一次能读取4个字节,64位CPU一次能读取8个字节。并且不能跨内存区间访问,这句话的意思可以理解为,如果CPU是32位的话,那么可以将整个内存区间每4个字节分为一块(BLOCK),每次读取一个BLOCK的数据。 那么对于下面这个结构体:
struct st {
char c;
int i;
};
如果不进行对齐操作,char 的地址范围0x00000000,int的地址范围为0x00000001----0x00000004,int分布在两个不同的BLOCK上,因此要读取int需要两次操作;如果进行4字节对齐,那么int的地址范围为0x00000004----0x00000007,处在一个BLOCK上,因此只需一次读取操作即可。缺点也显而易见,多占用了3个字节。这也是典型的一种空间换时间的方法吧。
结构体对齐的规则
结构体对齐需要满足以下三条规则,其中系统对齐模数在64位机器上默认为8字节,32位机器上默认为4字节。通过预处理指令#pargma pack(N)可以修改系统模数为N个字节。 1、以结构体第一个元素的地址为起始地址,亦即结构体的起始地址。由上可知,第一个元素的偏移量为0; 2、结构体元素对齐原则:结构体成员的对齐模数为类型大小与系统对齐模数的较小者;结构体成员的偏移量(填充)为对齐模数的整数倍。 3、结构体大小对齐原则:结构体的对齐模数为结构体最大元素与系统对齐模数的较小者;结构体的大小(填充)为结构体对齐模数的整数倍。
程序验证
测试环境为64位Windows ,VS2019,定义结构体st1,包含3个元素char,int,double,定义系统对齐模数为4个字节。
#include <iostream>
#pragma pack(4)
using Tsize = unsigned long long;
using namespace std;
struct st1 {
char c;
int i;
double db;
Tsize ch_offset() {
return Tsize((Tsize)&this->c - (Tsize)this);
}
Tsize int_offset() {
return Tsize((Tsize)&this->i - (Tsize)this);
}
Tsize double_offset() {
return Tsize((Tsize)&this->db - (Tsize)this);
}
};
int main() {
cout << "st1结构体大小" << sizeof(st1) << endl;
cout << "char 偏移量=" << st1().ch_offset() << endl;
cout << "int偏移量=" << st1().int_offset() << endl;
cout << "double偏移量=" << st1().double_offset() << endl;
return 0;
}
首先我们按照对齐规则来进行分析。第一个元素为char,类型大小为1个字节,对齐模数min(1,4)=1,偏移量为0是对齐模数的整数倍,无需填充(从这里我们可以看到,第一个字节偏移量始终为0,是不需要填充的),下一个元素的偏移从1开始;第二个元素为int,类型大小4个字节,对齐模数为4个字节,不填充时偏移量为1,不是4的整数倍,因此这里需要填充3个字节,使得int的偏移量为4,且下一个元素偏移从8开始;第三个元素是double,类型大小为8个字节,对齐模数为4,偏移量从8开始,是4的整数倍,因此无需填充,占用8个字节,因此结构体的大小为16个字节。运行程序输出: 将系统对齐模数修改为1 【#pargma pack(1)】,这样的话,任何情况下都无需填充(不足一个字节的类型视为一个字节),结构体的大小即为结构体元素大小之和。运行程序输出: 将系统对齐模数修改为8 【#pargma pack(8)】,这样的话,任何情况下都无需填充(不足一个字节的类型视为一个字节),结构体的大小即为结构体元素大小之和。运行程序输出: Emmm,好像和系统对齐模数为4时没什么变化。那我们将int 和 double的顺序换一下呢?
#include <iostream>
#pragma pack(8)
using Tsize = unsigned long long;
using namespace std;
struct st1 {
char c;
double db;
int i;
Tsize ch_offset() {
return Tsize((Tsize)&this->c - (Tsize)this);
}
Tsize int_offset() {
return Tsize((Tsize)&this->i - (Tsize)this);
}
Tsize double_offset() {
return Tsize((Tsize)&this->db - (Tsize)this);
}
};
int main() {
cout << "st1结构体大小" << sizeof(st1) << endl;
cout << "char 偏移量=" << st1().ch_offset() << endl;
cout << "double偏移量=" << st1().double_offset() << endl;
cout << "int偏移量=" << st1().int_offset() << endl;
return 0;
}
顺序调了下,结构体就比原来大了8个字节!!!从中我们可以看出,将结构体元素从小到大排列,可以最大程度节省空间。
一起学习,一起进步!如果有错误的地方,还恳请批评指正!
|