让 std::valarray 到 (google/quick) 正确地工作
Getting std::valarray to (google/quick) bench properly
我正在尝试比较使用 std::valarray
与使用 Google Bench 的 std::vector
/std::transform
操作的性能。我正在使用 QuickBench。
我的代码(用于 QuickBench)是
#include <random>
class RG {
public:
double operator()() noexcept { return dis(gen); }
private:
std::mt19937 gen {std::random_device{}()};
std::uniform_real_distribution<> dis {0.0, 100.0};
};
static RG rg {};
static constexpr auto N = 1000;
#include <vector>
#include <algorithm>
static void Vector(benchmark::State& state) {
std::vector<double> v1, v2;
v1.reserve(N); v2.reserve(N);
std::generate_n(back_inserter(v1),N,rg);
std::generate_n(back_inserter(v2),N,rg);
for (auto _ : state) {
std::vector<double> v3; v3.reserve(N);
std::transform(cbegin(v1), cend(v1), cbegin(v2), back_inserter(v3),
[](auto d1, auto d2) noexcept { return 0.5*d1+1.5*d2;});
benchmark::DoNotOptimize(v3);
}
}
// Register the function as a benchmark
BENCHMARK(Vector);
#include <valarray>
static void ValArray(benchmark::State& state) {
std::valarray<double> v1{N}, v2{N};
std::generate(begin(v1),end(v1),rg);
std::generate(begin(v2),end(v2),rg);
for (auto _ : state) {
std::valarray<double> v3{};
v3=0.5*v1+1.5*v2;
benchmark::DoNotOptimize(v3);
}
}
BENCHMARK(ValArray);
QuickBench link
Quickbench 说 std::valarray
比 std::vector
快 72 倍。那不可能是对的,对吧?
我做错了什么?
第 36 行:
std::valarray<double> v1{N}, v2{N};
这将创建两个单元素 valarray
-s,即每个包含一个值为 N=1000
的元素。这是因为列表初始化语法 {}
使用采用 std::initializer_list
:
的构造函数
valarray(std::initializer_list<T> il);
它使用该列表的内容构造一个 valarray
,而不是预期的内容:
explicit valarray(std::size_t count);
这将构建 valarray
个 count
元素。
您需要将该行更改为:
std::valarray<double> v1(N), v2(N);
我正在尝试比较使用 std::valarray
与使用 Google Bench 的 std::vector
/std::transform
操作的性能。我正在使用 QuickBench。
我的代码(用于 QuickBench)是
#include <random>
class RG {
public:
double operator()() noexcept { return dis(gen); }
private:
std::mt19937 gen {std::random_device{}()};
std::uniform_real_distribution<> dis {0.0, 100.0};
};
static RG rg {};
static constexpr auto N = 1000;
#include <vector>
#include <algorithm>
static void Vector(benchmark::State& state) {
std::vector<double> v1, v2;
v1.reserve(N); v2.reserve(N);
std::generate_n(back_inserter(v1),N,rg);
std::generate_n(back_inserter(v2),N,rg);
for (auto _ : state) {
std::vector<double> v3; v3.reserve(N);
std::transform(cbegin(v1), cend(v1), cbegin(v2), back_inserter(v3),
[](auto d1, auto d2) noexcept { return 0.5*d1+1.5*d2;});
benchmark::DoNotOptimize(v3);
}
}
// Register the function as a benchmark
BENCHMARK(Vector);
#include <valarray>
static void ValArray(benchmark::State& state) {
std::valarray<double> v1{N}, v2{N};
std::generate(begin(v1),end(v1),rg);
std::generate(begin(v2),end(v2),rg);
for (auto _ : state) {
std::valarray<double> v3{};
v3=0.5*v1+1.5*v2;
benchmark::DoNotOptimize(v3);
}
}
BENCHMARK(ValArray);
QuickBench link
Quickbench 说 std::valarray
比 std::vector
快 72 倍。那不可能是对的,对吧?
我做错了什么?
第 36 行:
std::valarray<double> v1{N}, v2{N};
这将创建两个单元素 valarray
-s,即每个包含一个值为 N=1000
的元素。这是因为列表初始化语法 {}
使用采用 std::initializer_list
:
valarray(std::initializer_list<T> il);
它使用该列表的内容构造一个 valarray
,而不是预期的内容:
explicit valarray(std::size_t count);
这将构建 valarray
个 count
元素。
您需要将该行更改为:
std::valarray<double> v1(N), v2(N);