std::function() 存储在容器中时到底做了什么?

What exactly std::function() does when stored in a container?

当存储在容器中时,std::function 构造函数究竟做了什么?

本次测试代码:

struct A {
    int sn;
    A() = delete;
    A(int v) : sn(v) { cout << "A::init(" << sn << ')' << endl; }
    A(const A& a) : sn(a.sn+1) { cout << "A::copy(" << sn << ')' << endl; }
    A(A&& a) : sn(a.sn+1) { cout << "A::move(" << sn << ')' << endl; }
    ~A() { cout << "A::delete(" << sn << ')' << endl; }
};

void func(int a, A &b) {
    cout << "func2:" << a << ',' << b.sn << endl;
}

int main(int argc, char *argv[]) {
    std::vector<std::function<void(void)>> fv;
    A a(1);
    cout << "call bind()" << endl;
    fv.emplace_back(std::bind(func,1,a));
    fv.front()();
    cout << "end of local scope" << endl;
}

我声明了class A的移动和复制构造函数来累积一个序列号,这样我就可以跟踪它作为第N个创建的实例。结果是:

A::init(1)
call bind()
A::copy(2)
A::move(3)
A::move(4)
A::delete(3)
A::delete(2)
func2:1,4
end of local scope
A::delete(1)
A::delete(4)

首先在 main() 本地范围内创建实例 a(1),然后在调用 std::bind() 时将其复制为新实例 a(2),然后再次移动到 std::function 动态分配的内存(或其内部内存片段?)来保存 std::bind() 实例的副本,所以我们有 A 的第 3 个实例由 std::function 实例保存。

至此可以理解,但为什么还有另一个移动结构?以及为什么第三个实例在第二个实例之前被销毁,而第二个实例应该在 std::bind() returns 时被清除?

如果我将 main() 函数重写为:

int main(int argc, char *argv[]) {
    A a(1);
    cout << "call bind()" << endl;
    std::function<void(void)> f(std::bind(func,1,a));
    f();
    cout << "end of local scope" << endl;
}

那么结果就是:

A::init(1)
call bind()
A::copy(2)
A::move(3)
A::delete(2)
func2:1,3
end of local scope
A::delete(3)
A::delete(1)

没有二步构造,一切看起来都很合理。

在这种情况下调用 emplace_back() 创建 std::function 实例时到底发生了什么?

First an instance a(1) is created in main() local scope, then it's copied as a new instance a(2) when calling std::bind(), then moved again into std::function dynamically allocated memory

您错过了一个步骤:std::function 的构造函数需要 by-value

template<typename F>
std::function<void(void)>::function(F f);

emplace_back 正在转发包含 a(2) 作为右值的 std::bind-wrapper,是的,但是这个构造函数只接受值,而不接受右值引用,所以 a(2) 被移动并变成 a(3) 只是为了初始化构造函数的参数。 然后构造函数将该值移出到动态存储中。

int main() {
    A a(1); // A::init(1)
    // this is the temporary that gets materialized in main's scope for the call to emplace_back
    auto wrapper = std::bind(func, 1, a); // A::copy(2);
    // emplace_back receives (a reference to) the temporary as an rvalue, and so it passes std::function's constructor a reference to the same object, also as an rvalue
    // but std::function's constructor only takes values...
    std::function<void(void)> f(std::move(wrapper));
    // initializing the parameter of constructor (in main/emplace_back's context): A::move(3)
    // constructor then initializes dynamically allocated object: A::move(4)
    // constructor destroys parameter object: A::delete(3)
    // f gets destroyed, takes dynamically allocated object with it: A::delete(4)
    // wrapper (the temporary) gets destroyed (originally at the ; after emplace_back): A::delete(2)
    // a gets destroyed: A::delete(1);
}
// Note: the reason A::delete(4) comes before A::delete(1) in my version but not yours is that your A(4) lives inside fv, which is created at the top of main and thus is the last thing destroyed, but mine lives inside f, which is created at the end and is the first thing destroyed

简化的不同之处在于您没有将 std::bind 的结果具体化为临时的。基本上,emplace_back 要求参数已经完全构造(就像任何函数调用一样)。所以你必须执行 std::bind (和它里面的副本)只是为了调用 emplace_back,然后 然后 emplace_back 将该对象移动到构造函数范围。但是,当您将 std::bind 纯右值直接传递给 std::function 构造函数时,构造函数参数对象是通过在执行期间将 std::bind 的结果对象设置为参数对象而直接构造的。

换一种说法:std::function的构造函数必须用新创建的对象调用。当使用 emplace_back 时,干预函数“忘记”了 std::bind 调用是一个新构造的对象,因此通过执行“无关”的移动来构造一个新对象。当您删除 emplace_back 时,不会忘记 std::bind 对象是新建的这一事实,并且移动被省略。

另一种说法:emplace_back所声称的“完美”转发实际上并不完美;这样的事情是不可能的(必须修改用户代码)。 “完美”转发将左值转发为左值,但将 xvalues 和 prvalues 折叠为 xvalues(通过要求在调用函数之前实现 prvalues)。使用亡值调用 std::function 的构造函数会导致两次移动,但使用纯右值调用会导致一次移动。您的第二个版本将纯右值传递给构造函数,但原始版本传递了一个亡值,因此它们具有不同的行为。

您可以使用包装函子获得所需的结果:

template<typename F>
struct initializer {
    F f;
    operator decltype(f())() && {
        return std::move(f)();
    }
};
int main(int argc, char *argv[]) {
    std::vector<std::function<void(void)>> fv;
    A a(1);
    cout << "call bind()" << endl;
    fv.emplace_back(
        initializer{[&]() -> std::function<void(void)> {
            return std::bind(func, 1, a);
        }});
    fv.front()();
    cout << "end of local scope" << endl;
}

这将对std::bind的调用直接置于对std::function的构造函数(在return中)的调用之下,因此纯右值直接初始化构造函数参数而没有干预举动。 std::function 也是直接在 vector 中的“空”space 中构造的,没有进一步移动(毕竟 emplace_back 就是这样做的)。