嵌入式C语言中字节对齐的问题
嵌入式C语言中,字节对齐的问题主要出现在结构体中,我们先来看一下结构体的定义。
结构体struct的定义
在C语言中,结构体是一种复合数据类型,其构成元素既可以是基本数据类型(如int、long、float等)的变量,也可以是一些复合数据类型(如数组、结构、联合等)的数据单元。
在结构体中,编译器为结构体的每个成员按其自然边界(alignment)分配空间。各个成员按照它们被声明的顺序在内存中顺序存储,第一个成员的地址和整个结构的地址相同。
接下来,我们再来看一下结构体在单片机中的实际物理地址的分配,也就是结构体变量所在实际实际硬件存储位置。
物理地址的分配
为了使单片机能够对变量进行快速的访问,变量的起始地址应该具有某些特性,即所谓的“对齐”。 比如4字节的int型(32位单片机),其起始地址应该位于4字节的边界上,即起始地址能够被4整除。
字节对齐的作用
字节对齐的作用不仅是便于cpu快速访问,同时合理地利用字节对齐可以有效地节省存储空间。
对于32位机来说,4字节对齐能够使cpu访问速度提高,比如说一个long类型的变量,如果跨越了4字节边界存储,那么cpu要读取两次,这样效率就低了。但是在32位机中使用1字节或者2字节对齐,反而会使变量访问速度降低。所以这要考虑处理器类型,另外还得考虑编译器的类型。
在缺省情况下,C编译器为每一个变量或是数据单元按其自然对界条件分配空间。一般地,可以通过下面的方法来改变缺省的对界条件:
1、使用伪指令#pragma pack (n),C编译器将按照n个字节对齐。
2、 使用伪指令#pragma pack (),取消自定义字节对齐方式。
例如,
struct test
{
char x1;
short x2;
float x3;
char x4;
};
由于编译器默认情况下会对这个struct作自然边界对齐,结构的第一个成员x1,其偏移地址为0,占据了第1个字节。第二个成员x2为short类型,其起始地址必须2字节对界,因此,编译器在x2和x1之间填充了一个空字节。结构的第三个成员x3和第四个成员x4恰好落在其自然边界地址上,在它们前面不需要额外的填充字节。在test结构中,成员x3要求4字节对界,是该结构所有成员中要求的最大边界单元,因而test结构的自然对界条件为4字节,编译器在成员x4后面填充了3个空字节。整个结构所占据空间为12字节。
如果采用伪指令#pragma pack (n),可以强制n个字节对齐:
#pragma pack(1) //让编译器对这个结构作1字节对齐
struct test
{
char x1;
short x2;
float x3;
char x4;
};
#pragma pack() //取消1字节对齐,恢复为默认4个字节对齐
这时候sizeof(struct test)的值为8。
字节对齐对程序执行的影响
各个硬件平台对存储空间的处理上有很大的不同。一些平台对某些特定类型的数据只能从某些特定地址开始存取。比如有些架构的单片机在访问一个没有进行对齐的变量的时候会发生错误,那么在这种架构下编程就必须保证字节对齐,其他平台可能没有这种情况。比如有些单片机,只能做偶地址存储,你如果不小心用到了奇地址,可能会产生莫名其妙的错误。还有的单片机为了多省几根地址线,对于存储地址的访问必须要求是4的倍数或者是8的倍数。
还有种情况就是,如果不按照适合其平台要求对数据存放进行对齐,会在存取效率上带来损失。比如有些平台每次都都是从偶地址开始,如果一个int型(假设为32位系统)如果存放在偶地址开始的地方,那么一个读周期就可以读出这32bit,而如果存放在奇地址开始的地方,就需要2个读周期,并对两次读出的结果的高低字节进行拼凑才能得到该32bit数据。这样显然在读取效率上下降很多。
