为什么 C++ 使用 memset(addr,0,sizeof(T)) 来构造一个对象?标准错误还是编译器错误?

why c++ use memset(addr,0,sizeof(T)) to construct a object? Standard or compiler bug?

这个问题与我的另一个 post 有关:why allocate_shared and make_shared so slow

在这里我可以把问题描述的更清楚

想想下面的代码:

struct A {
    char data_[0x10000];
};

class C {
public:
    C() : a_() { }
    A a_;
};

int main() {
    C c;
    return 0;
}

我发现对于代码C() : a_(),编译器使用memset(addr,0,0x10000)作为A的构造函数。如果类型A有一个空构造函数,那么asm代码是正确的。

为了更清楚地描述问题,我写了一些测试代码:

#include <stdlib.h>

struct A {
    //A() {}
    char data_[0x10000];
    void dummy() { // avoid optimize erase by compiler
        data_[rand() % sizeof(data_)] = 1;
    }
    int dummy2() { // avoid optimize erase by compiler
        return data_[0];
    }
};

class B {
public:
    template<class ... T> B(T&...t) 
        : a_(std::forward<T>(t)...) {
    }
    A a_;
};

class C {
public:
    C() : a_() {
    }
    A a_;
};

template<class ... T>
int test(T&...t) {
    A a(t...);
    a.dummy();
    return a.dummy2();
}

int main() {
    A a;
    a.dummy();
    auto r1 = a.dummy2();

    auto r2 = test();

    B b;
    b.a_.dummy();
    auto r3 = b.a_.dummy2();

    C c;
    c.a_.dummy();
    auto r4 = c.a_.dummy2();
    return r1 + r2 + r3 + r4;
}

我用 vs2017 编译了代码,在 windows 10,x86 发布版本中。 然后我检查了asm代码:

template<class ... T>
int test(T&...t) {
00E510B8  call        _chkstk (0E51CE0h)  
00E510BD  mov         eax,dword ptr [__security_cookie (0E53004h)]  
00E510C2  xor         eax,ebp  
00E510C4  mov         dword ptr [ebp-4],eax  
    A a(t...);
00E510C7  push        10000h  
00E510CC  lea         eax,[a]  
00E510D2  push        0  
00E510D4  push        eax  
00E510D5  call        _memset (0E51C3Ah)  
00E510DA  add         esp,0Ch  
    a.dummy();
00E510DD  call        dword ptr [__imp__rand (0E520B4h)]  
}
00E510E3  mov         ecx,dword ptr [ebp-4]  

很明显函数test()调用了memset(p, 0, 0x10000).

如果我在 A 中添加一个空构造函数(第 A(){} 行),编译器会删除内存集。

那么为什么代码在类型A没有构造函数时调用memset,而在A有构造函数时代码不调用memset?

它是 c++ 标准的一部分,还是只是一个编译器错误?

显然 memset(p, 0, sizeof(T)) 是无用且有害的,它会减慢程序速度。我该如何解决?

A a(t...);

将被解析为用 t... 初始化 at... 为空时,就像您调用它时一样,这将理解为 value-initializing a.

对于没有用户提供的默认构造函数的 Avalue-initialize 会将其所有成员归零,因此 memset.

当你为A提供构造函数时,value-initialize是调用默认构造函数,你定义为什么都不做,所以没有memset 将被调用。

这不是编译器中的错误,这是必需的行为。要删除多余的 memset,您可以只写 A a;。在这种情况下 a 默认初始化的 并且没有自动归零发生,有或没有用户提供的构造函数。

† 这很重要,因为 A a() 将被解析为名为 a 且 return 类型为 A[ 的函数=25=]

this解释一下吗?

我们可以看到:

Zero initialization is performed [...] as part of value-initialization sequence for [...] members of value-initialized class types that have no constructors, including value initialization of elements of aggregates for which no initializers are provided.

...

Value initialization is performed [...] when a non-static data member or a base class is initialized using a member initializer with an empty pair of parentheses or braces (since C++11);

因此将 a_() 放入成员初始化器列表属于后一种情况,结果调用数组的零初始化。

回答你的问题:对我来说,这似乎是一种标准行为,而不是编译器错误。