如何在 C++11 中从 std::future 中正确 return 大数据

How to properly return large data from a std::future in c++11

我有点困惑 return 从 c++ 中的异步函数获取大数据的正确方法是什么。

以这段代码为例。它在函数中创建一个大向量,并 returns 分配的向量。

#include <unistd.h>

#include <iostream>
#include <chrono>

#include <future>
#include <vector>

using timepoint = std::chrono::time_point<std::chrono::system_clock>;

timepoint start_return;

std::vector< int > test_return_of_large_vector(void)
{
    std::vector< int > ret(100000000);
    start_return = std::chrono::system_clock::now();
    return ret;                          // MOVE1
}


int main(void)
{

    timepoint start = std::chrono::system_clock::now();
    auto ret = test_return_of_large_vector();
    timepoint end = std::chrono::system_clock::now();

    auto dur_create_and_return = std::chrono::duration_cast< std::chrono::milliseconds >(end - start);
    auto dur_return_only = std::chrono::duration_cast< std::chrono::milliseconds >(end - start_return);

    std::cout << "create & return time : " << dur_create_and_return.count() << "ms\n";
    std::cout << "return time : " << dur_return_only.count() << "ms\n";

    auto future = std::async(std::launch::async, test_return_of_large_vector);
    sleep(3); // wait long enough for the future to finish its work

    start = std::chrono::system_clock::now();
    ret = future.get();                  // MOVE2
    end = std::chrono::system_clock::now();

    // mind that the roles of start and start_return have changed
    dur_return_only = std::chrono::duration_cast< std::chrono::milliseconds >(end - start);
    dur_create_and_return = std::chrono::duration_cast< std::chrono::milliseconds >(end - start_return);

    std::cout << "duration since future finished: " << dur_create_and_return.count() << "ms\n";
    std::cout << "return time from future: " << dur_return_only.count() << "ms\n";

    return 0;
}

对我来说这打印

create & return time : 543ms
return time : 0ms
duration since future finished: 2506ms
return time from future: 14ms
//                      ^^^^^^

很明显,当在主线程中调用函数时,return 值省略或移动完成了。但是未来的 return 值显然被复制了。此外,在 MOVE[1,2] 标记的行中尝试 std::move 时,future.get() 调用的 return 时间保持不变。另一方面,当 returning 一个指针时,future.get() 的 return 时间可以忽略不计(对我来说是 0 毫秒)。

那么大数据是否必须通过指针从 futures return 中提取?

问题是您正在 分配 ret,它已经保存了您第一次调用 test_return_of_large_vector 的结果。那么,您的代码至少需要释放 100000000 * sizeof int 个字节; vector::operator=(vector&&) 的移动赋值被指定为具有恒定的复杂性(对于适当的分配器),但是移动源的析构函数需要时间。

如果您先调用 ret.clear(); ret.shrink_to_fit();,那么 "return time from future" 会下降到 0 毫秒 (example)。

或者你可以移动构造一个不同的变量:

auto ret2 = future.get();                  // MOVE2