打破严格的别名并摆脱它

breaking strict aliasing and getting away with it

众所周知,优化 C(可能还有 C++)编译器会破坏执行以下操作的代码:

type1 foo, *pfoo;
type2_incompatible_with_type1 *pbar;
/* ... */
pfoo = &foo;
pbar = (type2_incompatible_with_type1*)pfoo;
/* ... */
while(condition){
    change_type2_value(pbar);
    /* ... */
    use_type1_value_which_should_have_changed(*pfoo);
    /* ... */
}

其中 change_type2_value 看起来像这样:

void change_type2_value(type2_incompatible_with_type1 *pbar){
    *pbar = SOME_VALUE;
}

编译器可能会考虑 pfoopbar 不同的指针,尽管它们指向相同的内存位置,因此不必每次都重新加载 *pfoo 的内容我们更改了 pbar 指向的值,即使它也更改了 pfoo 指向的内存。

但是,如果我们这样做:

type1 foo, *pfoo;
/* ... */
pfoo = &foo;
/* ... */
while(condition){
    change_type2_value((type2_incompatible_with_type1*)pfoo);
    /* ... */
    use_type1_value_which_should_have_changed(*pfoo);
    /* ... */
}

尽管取消引用将发生在 change_type2_value 函数内 ,这在技术上仍然打破了严格的别名,因为实际上,我们的指针指向不同的类型。但是,是否存在真实编译器使用的严格别名优化也会破坏此代码的真实条件?

我认为如果编译器超出当前函数的范围去查看另一个函数中应该发生什么只是为了弄清楚它是否应该重新加载,这将是一种可能性传递给它的变量指向的内存。这对我来说似乎不太可行。

或者真正的编译器是否有可能做一些像假设所讨论的函数将改变我们的指针指向的内存一样讨厌的事情,如果我们传入它作为 转换为指向不兼容类型的指针?

严格遵守?号

看下面:

void bar(){
    int x=7;
    foo();
    printf("%d\n",x);
}

打印了 x 的什么值?是7。foo()修改x没有合法途径。

怎么样

void bar(int* x){
    *x=7;
    foo();
    printf("%d\n",*x);
}

所有赌注都取消了。 foo() 可以通过其他方式访问 x 指向的地址。我们不能说,编译器可能和我们这里一样没有什么可做的。 这取决于 foo() 的定义位置和方式以及编译器的整体性。 例如,如果 foo()inline

现在你所做的是在 before 传递给 change_type2_value(.) 并且因为它不严格符合取消引用该指针,所以编译器仍然符合假设 change_type2_value(.) 没有取消引用它的参数,如果它是一个局部变量(你的代码片段没有说清楚)它绝对可以假设它没有改变。

下一点是个坏主意

如果您将该调用替换为以下调用会怎样:

void do_secret_stuff_with_type1(type1* t1){
    type2_incompatible_with_type1* pbar = (type2_incompatible_with_type1*)pfoo;
    change_type2_value((type2_incompatible_with_type1*)pfoo);
}

type1 foo, *pfoo;
/* ... */
pfoo = &foo;
/* ... */
while(condition){
    do_secret_stuff_with_type1(pfoo); //Looks innocent, right?
    /* ... */
    use_type1_value_which_should_have_changed(*pfoo);
    /* ... */
}

同理。这肯定会让编译器更难发现正在发生的事情。如果 do_secret_stuff_with_type1() 是在单独的翻译单元中定义的,那么您将逐渐增加混淆编译器的机会。

坏主意结束

然而,这种黑客攻击几乎可以肯定是一个可怕的想法。 你为什么要这样做? 忘记别名你在做什么,在不兼容的类型之间进行转换会产生一个有用的程序?

对于任何实际情况,几乎总是有一个解决方案涉及通过 unsigned char* 访问对象或使用 memcpy() 复制,在某些情况下使用 union 将不一致的程序变成符合标准的程序。