混淆数据地址对齐

Confuse about data address alignment

我对

提供的答案有疑问

@dan04。 What is aligned memory allocation?

特别是,如果我有这样的事情:

int main(){
      int num;  // 4byte
      char s;   // 1byte
      int *ptr;


}

如果我有一台 32 位机器,你认为它仍然会默认填充数据吗?

上一个问题问的是struct,我问的是main声明的变量。

更新:

a = 2 bytes 
b = 4 bytes
c = 1 byte
d = 1 byte



 0 1 2 3 4 5 6 7
|a|a|b|b|b|b|c|d|  bytes
|       |       |  words

没有这方面的规则。这取决于您使用的实现。此外,它可能会根据编译器选项而改变。您能做的最好的事情就是打印每个变量的地址。然后就可以看到内存布局如何了

像这样:

int main(void)
{
  int num; 
  char s;   
  int *ptr;

  printf("num: %p - size %zu\n", (void*)&num, sizeof num);
  printf("s  : %p - size %zu\n", (void*)&s, sizeof s);
  printf("ptr: %p - size %zu\n", (void*)&ptr, sizeof ptr);

  return 0;
}

可能的输出:

num: 0x7ffee97fce84 - size 4
s  : 0x7ffee97fce83 - size 1
ptr: 0x7ffee97fce88 - size 8

另请注意,如果您不获取变量的地址 (&),编译器可能会优化您的代码,使变量永远不会被放入内存。

一般来说,对齐通常是为了从所使用的硬件平台中获得最佳性能。这通常意味着变量与其大小对齐,或者对于大小大于 4 的变量至少对齐 4 字节。

更新:

OP 在更新中给出了一个具体的布局示例,并询问该布局是否 can/will 曾经发生过。

同样答案是:它取决于实现

所以原则上它可能发生在某些特定系统上。也就是说,我怀疑它会发生在任何主流系统上。

还有另一个用gcc -O3

编译的代码示例
int main(void)
{
  short s1;
  int i1;
  char c1;
  int i2;
  char c2;


  printf("s1: %p - size %zu\n", (void*)&s1, sizeof s1);
  printf("i1: %p - size %zu\n", (void*)&i1, sizeof i1);
  printf("c1: %p - size %zu\n", (void*)&c1, sizeof c1);
  printf("i2: %p - size %zu\n", (void*)&i2, sizeof i2);
  printf("c2: %p - size %zu\n", (void*)&c2, sizeof c2);

  return 0;
}

我的系统输出:

s1: 0x7ffd222fc146 - size 2   <-- 2 byte aligned
i1: 0x7ffd222fc148 - size 4   <-- 4 byte aligned
c1: 0x7ffd222fc144 - size 1
i2: 0x7ffd222fc14c - size 4   <-- 4 byte aligned
c2: 0x7ffd222fc145 - size 1

注意内存中的位置与代码中定义的顺序变量有何不同。这确保了良好的对齐。

按地址排序:

c1: 0x7ffd222fc144 - size 1
c2: 0x7ffd222fc145 - size 1
s1: 0x7ffd222fc146 - size 2   <-- 2 byte aligned
i1: 0x7ffd222fc148 - size 4   <-- 4 byte aligned
i2: 0x7ffd222fc14c - size 4   <-- 4 byte aligned

所以再次回答更新问题:

在大多数系统上,我怀疑您会看到一个 4 字节变量被放置在地址 xxx2、xxx6 或 xxxa、xxxe 处。但是,系统可能存在于可能发生这种情况的地方。

很难准确预测,但肯定会有一些填充。 以这两个代码为例(我运行他们在Coliru,64位机器上)

    #include<iostream>
#include <vector>
using namespace std;

//#pragma pack(push,1)
int main(){    
      int num1(5);  // 4byte
      int num2(3);   // 4byte
      char c1[2];
      c1[0]='a';
      c1[1]='a';
      cout << &num1 << " " << &num2 << " "  << endl;     
      cout << sizeof(c1) << " " << &c1 << endl;

}
//#pragma pack(pop)




    #include<iostream>
#include <vector>
using namespace std;

//#pragma pack(push,1)
int main(){    
      int num1(5);  // 4byte
      int num2(3);   // 4byte
      char c1[1];
      c1[0]='a';
      cout << &num1 << " " << &num2 << " "  << endl;     
      cout << sizeof(c1) << " " << &c1 << endl;

}
//#pragma pack(pop)

第一个程序输出:

0x7fff3e1f9de8 0x7fff3e1f9dec 
2 0x7fff3e1f9de0

而第二个程序输出:

0x7fffdca72538 0x7fffdca7253c 
1 0x7fffdca72537

你肯定会注意到第一个程序中有一个填充,查看地址我们可以看到: 第一个程序:CHAR |字符 | 6 字节填充 |内部 |情报局 第二个程序:CHAR |内部 |智力

所以对于基本问题,是的,默认情况下可能是填充。 我还尝试使用 pragma pack 来避免填充,与 struct 情况相反,我没能避免填充,因为输出完全相同。