成员结构位域元素的初始化列表初始化导致 IAR ARM 中的错误
Initializer list initialization of a member struct bitfield element causing bugs in IAR ARM
我在 IAR 中有以下 class 结构:
class A
{
public:
A(){}
virtual ~A() {};
virtual void load() {};
};
class C
{
public:
C()
{
//C does other stuff, not relevant
}
};
class D;
class B : public A
{
public:
B() : invert(false) {};
virtual ~B() {};
void load()
{
//Irrelevant stuff done here
}
private:
C member_c;
std::vector<D*> vector_of_d;
struct {
bool var_1:1;
bool var_2:1;
bool var_3:1;
bool var_4:1;
bool invert:1;
};
};
我 运行 遇到了为初始化 B 而生成的程序集的错误,其中似乎 'confused' 关于 VTable 指针的位置与匿名结构位域的位置。当它将反转位设置为假时,它会转到对象的第一个字(即 VTable 指针)并翻转地址中的一位。当我稍后调用 load()
时,它跟随无效的 VTable 指针并最终找到一个空指针,然后盲目地跟随它。事情显然从那里分崩离析。
以下是会引发此问题的代码示例:
void load_A(A* to_be_loaded){
if(to_be_loaded) to_be_loaded->load();
}
int main(){
load_A(new B());
}
现在的大问题是,我是否不小心在某处引入了一些未定义的行为?这是从 GCC-ARM 移植过来的代码,它在那里运行良好,但现在突然在使用 IAR 编译时导致硬故障。我的两个理论是:
- 这是一个编译器错误(我知道,它从来都不是编译器错误)
- 这是 GCC 作为扩展处理的非标准行为
据我所知,使用初始化列表初始化匿名结构中的字段应该没有任何问题。我确实认识到匿名结构 是 编译器扩展,但它们在 IAR 和 GCC 中都有记录。无论哪种方式,IAR 都没有给我任何警告或错误,并且正在生成明显损坏的程序集。
这是它为 B
构造函数
制作的程序集
1 | B() : invert(false) {};
2 |B::B():
3 |_ZN6BC1Ev:
4 | 0x80645e8: 0xb510 PUSH {R4, LR}
5 | 0x80645ea: 0x4604 MOV R4, R0
6 | B() : invert(false) {};
7 | 0x80645ec: 0xf007 0xfb20 BL A::subobject A() ; 0x806bc30
8 | 0x80645f0: 0x4807 LDR.N R0, [PC, #0x1c] ; 0x8088808 (134776840)
9 | 0x80645f2: 0x6020 STR R0, [R4]
10| 0x80645f4: 0xf104 0x0018 ADD.W R0, R4, #24 ; 0x18
11| 0x80645f8: 0xf00a 0xfadd BL C::C() ; 0x806ebb6
12| 0x80645fc: 0xf104 0x001c ADD.W R0, R4, #28 ; 0x1c
13| 0x8064600: 0xf00e 0xff2e BL std::vector<D *>::vector() ; 0x8073460
14| 0x8064604: 0x7820 LDRB R0, [R4]
15| 0x8064606: 0xf000 0x00ef AND.W R0, R0, #239 ; 0xef
16| 0x806460a: 0x7020 STRB R0, [R4]
17| B() : invert(false) {};
18| 0x806460c: 0x4620 MOV R0, R4
19| 0x806460e: 0xbd10 POP {R4, PC}
20| 0x8064610: 0x08088808 DC32 0x8088808 (134776840)
在第 14 行,我们加载 R4 指向的值,这是我们对象的基地址。它不对其应用任何偏移量,这意味着它指向对象中的第一个东西,即 VTable 指针。然后它继续假设它具有位域并在第 15 行取消设置一位,然后将其放回从第 16 行获取它的对象中。
作为参考,如果我们将 B 的构造函数更改为 不 使用初始化列表(如下所示),它将按预期工作:
class B : public A
{
public:
B(){ invert = false; };
virtual ~B() {};
void load()
{
//Irrelevant stuff done here
}
private:
C member_c;
std::vector<D*> vector_of_d;
struct {
bool var_1:1;
bool var_2:1;
bool var_3:1;
bool var_4:1;
bool invert:1;
}
};
生成的程序集如下,注意第14行和第16行LDRB
和STRB
指令中使用的偏移量。这是访问对象中位域的正确偏移量.
1 | B(){ invert = false; };
2 |B::B():
3 |_ZN6BC1Ev:
4 | 0x80645e8: 0xb510 PUSH {R4, LR}
5 | 0x80645ea: 0x4604 MOV R4, R0
6 | B(){ invert = false; };
7 | 0x80645ec: 0xf007 0xfb20 BL A::subobject A() ; 0x806bc30
8 | 0x80645f0: 0x4807 LDR.N R0, [PC, #0x20] ; 0x8088808 (134776840)
9 | 0x80645f2: 0x6020 STR R0, [R4]
10| 0x80645f4: 0xf104 0x0018 ADD.W R0, R4, #24 ; 0x18
11| 0x80645f8: 0xf00a 0xfadd BL C::C() ; 0x806ebb6
12| 0x80645fc: 0xf104 0x001c ADD.W R0, R4, #28 ; 0x1c
13| 0x8064600: 0xf00e 0xff2e BL std::vector<D *>::vector() ; 0x8073460
14| 0x8064604: 0x7820 LDRB R0, [R4, #0x2c]
15| 0x8064606: 0xf000 0x00ef AND.W R0, R0, #239 ; 0xef
16| 0x806460a: 0x7020 STRB R0, [R4, #0x2c]
17| B(){ invert = false; };
18| 0x806460c: 0x4620 MOV R0, R4
19| 0x806460e: 0xbd10 POP {R4, PC}
20| 0x8064610: 0x08088808 DC32 0x8088808 (134776840)
旁注,第 8 行略有变化,但这可能是由于某些偏移量变化所致。
有没有人知道是什么原因造成的?
这是一个编译器错误,根据我的调查,它至少会在 EWARM 7.80.1 和 8.11.2 中触发。它不会在 EWARM 8.20.1 中触发。该错误会在所有优化级别上触发,我想不出除了问题中提到的其他解决方法。
我在 IAR 中有以下 class 结构:
class A
{
public:
A(){}
virtual ~A() {};
virtual void load() {};
};
class C
{
public:
C()
{
//C does other stuff, not relevant
}
};
class D;
class B : public A
{
public:
B() : invert(false) {};
virtual ~B() {};
void load()
{
//Irrelevant stuff done here
}
private:
C member_c;
std::vector<D*> vector_of_d;
struct {
bool var_1:1;
bool var_2:1;
bool var_3:1;
bool var_4:1;
bool invert:1;
};
};
我 运行 遇到了为初始化 B 而生成的程序集的错误,其中似乎 'confused' 关于 VTable 指针的位置与匿名结构位域的位置。当它将反转位设置为假时,它会转到对象的第一个字(即 VTable 指针)并翻转地址中的一位。当我稍后调用 load()
时,它跟随无效的 VTable 指针并最终找到一个空指针,然后盲目地跟随它。事情显然从那里分崩离析。
以下是会引发此问题的代码示例:
void load_A(A* to_be_loaded){
if(to_be_loaded) to_be_loaded->load();
}
int main(){
load_A(new B());
}
现在的大问题是,我是否不小心在某处引入了一些未定义的行为?这是从 GCC-ARM 移植过来的代码,它在那里运行良好,但现在突然在使用 IAR 编译时导致硬故障。我的两个理论是:
- 这是一个编译器错误(我知道,它从来都不是编译器错误)
- 这是 GCC 作为扩展处理的非标准行为
据我所知,使用初始化列表初始化匿名结构中的字段应该没有任何问题。我确实认识到匿名结构 是 编译器扩展,但它们在 IAR 和 GCC 中都有记录。无论哪种方式,IAR 都没有给我任何警告或错误,并且正在生成明显损坏的程序集。
这是它为 B
构造函数
1 | B() : invert(false) {};
2 |B::B():
3 |_ZN6BC1Ev:
4 | 0x80645e8: 0xb510 PUSH {R4, LR}
5 | 0x80645ea: 0x4604 MOV R4, R0
6 | B() : invert(false) {};
7 | 0x80645ec: 0xf007 0xfb20 BL A::subobject A() ; 0x806bc30
8 | 0x80645f0: 0x4807 LDR.N R0, [PC, #0x1c] ; 0x8088808 (134776840)
9 | 0x80645f2: 0x6020 STR R0, [R4]
10| 0x80645f4: 0xf104 0x0018 ADD.W R0, R4, #24 ; 0x18
11| 0x80645f8: 0xf00a 0xfadd BL C::C() ; 0x806ebb6
12| 0x80645fc: 0xf104 0x001c ADD.W R0, R4, #28 ; 0x1c
13| 0x8064600: 0xf00e 0xff2e BL std::vector<D *>::vector() ; 0x8073460
14| 0x8064604: 0x7820 LDRB R0, [R4]
15| 0x8064606: 0xf000 0x00ef AND.W R0, R0, #239 ; 0xef
16| 0x806460a: 0x7020 STRB R0, [R4]
17| B() : invert(false) {};
18| 0x806460c: 0x4620 MOV R0, R4
19| 0x806460e: 0xbd10 POP {R4, PC}
20| 0x8064610: 0x08088808 DC32 0x8088808 (134776840)
在第 14 行,我们加载 R4 指向的值,这是我们对象的基地址。它不对其应用任何偏移量,这意味着它指向对象中的第一个东西,即 VTable 指针。然后它继续假设它具有位域并在第 15 行取消设置一位,然后将其放回从第 16 行获取它的对象中。
作为参考,如果我们将 B 的构造函数更改为 不 使用初始化列表(如下所示),它将按预期工作:
class B : public A
{
public:
B(){ invert = false; };
virtual ~B() {};
void load()
{
//Irrelevant stuff done here
}
private:
C member_c;
std::vector<D*> vector_of_d;
struct {
bool var_1:1;
bool var_2:1;
bool var_3:1;
bool var_4:1;
bool invert:1;
}
};
生成的程序集如下,注意第14行和第16行LDRB
和STRB
指令中使用的偏移量。这是访问对象中位域的正确偏移量.
1 | B(){ invert = false; };
2 |B::B():
3 |_ZN6BC1Ev:
4 | 0x80645e8: 0xb510 PUSH {R4, LR}
5 | 0x80645ea: 0x4604 MOV R4, R0
6 | B(){ invert = false; };
7 | 0x80645ec: 0xf007 0xfb20 BL A::subobject A() ; 0x806bc30
8 | 0x80645f0: 0x4807 LDR.N R0, [PC, #0x20] ; 0x8088808 (134776840)
9 | 0x80645f2: 0x6020 STR R0, [R4]
10| 0x80645f4: 0xf104 0x0018 ADD.W R0, R4, #24 ; 0x18
11| 0x80645f8: 0xf00a 0xfadd BL C::C() ; 0x806ebb6
12| 0x80645fc: 0xf104 0x001c ADD.W R0, R4, #28 ; 0x1c
13| 0x8064600: 0xf00e 0xff2e BL std::vector<D *>::vector() ; 0x8073460
14| 0x8064604: 0x7820 LDRB R0, [R4, #0x2c]
15| 0x8064606: 0xf000 0x00ef AND.W R0, R0, #239 ; 0xef
16| 0x806460a: 0x7020 STRB R0, [R4, #0x2c]
17| B(){ invert = false; };
18| 0x806460c: 0x4620 MOV R0, R4
19| 0x806460e: 0xbd10 POP {R4, PC}
20| 0x8064610: 0x08088808 DC32 0x8088808 (134776840)
旁注,第 8 行略有变化,但这可能是由于某些偏移量变化所致。
有没有人知道是什么原因造成的?
这是一个编译器错误,根据我的调查,它至少会在 EWARM 7.80.1 和 8.11.2 中触发。它不会在 EWARM 8.20.1 中触发。该错误会在所有优化级别上触发,我想不出除了问题中提到的其他解决方法。