如何将可变参数函数与 TBB parallel_for 并行?
How to parallel variadic function with TBB parallel_for?
我有一个像这样的模板可变参数函数需要与 TBB parallel_for
函数并行化
template<typename T1, typename T2, typename... T3>
void func(T1 t1, T2 t2, std::size_t n, T3... t3)
我第一次尝试使用 lambda 函数,它能够捕获可变参数。它使用 C++11 功能通过 clang 编译。
template<typename T1, typename T2, typename... T3>
void parallel_func(T1 t1, T2 t2, std::size_t n, T3 t3...){
range r(n);
apply_func = [=](range r){ //clang 6.1 can catch t3... here, gcc 4.8.3 could not
std::size_t offset = r.begin();
std::size_t n = r.end() -r.begin();
func(t1, t2, n, (t3+offset)...);
};
tbb::parallel_for(r, apply_func);
}
但是,我使用的集群没有编译器来支持这个特性。我不得不放弃 lambda 函数并编写一个 class 并将其传递给 parallel_for
函数。
我试过了:
template<typename T1, typename T2, typename... T3>
class ApplyFunc{
ApplyFunc(T1 t1, T2 t2, T3... t3){
t1_ = t1;
t2_ = t2;
t3_ = t3...;
}
void operator(range r){
std::size_t offset = r.begin();
std::size_t n = r.end() -r.begin();
func(T1, T2, n, (T3+offset)...);
}
private:
T1 t1_;
T2 t2_;
T3... t3_;
}
显然,不支持可变变量。我试过
std::tuple t3_;
但是,我无法将 std::tuple<T3...>
转换回可变参数。
您可以使用 std::tuple<Ts...>
来保存可变值,并为此目的使用 the indices trick. C++14 Standard Library provides std::index_sequence
扩展它以进行函数调用。
#include <tuple>
// forward compatibility for C++14 Standard Library
namespace cxx14 {
template<std::size_t...> struct index_sequence{};
template<std::size_t N, std::size_t... Is>
struct make_index_sequence : make_index_sequence<N-1, N-1, Is...>{};
template<std::size_t... Is>
struct make_index_sequence<0, Is...> : index_sequence<Is...>{};
}
template<typename T1, typename T2, typename... Ts>
class ApplyFunc{
public:
ApplyFunc(T1 t1, T2 t2, Ts... ts)
: t1_(t1), t2_(t2), pack_(ts...) {}
template<std::size_t... Is>
void call(range r, cxx14::index_sequence<Is...>){
std::size_t offset = r.begin();
std::size_t n = r.end() - r.begin();
func(t1_, t2_, n, (std::get<Is>(pack_)+offset)...);
}
void operator()(range r){
call(r, cxx14::make_index_sequence<sizeof...(Ts)>());
}
private:
T1 t1_;
T2 t2_;
std::tuple<Ts...> pack_;
};
我有一个像这样的模板可变参数函数需要与 TBB parallel_for
函数并行化
template<typename T1, typename T2, typename... T3>
void func(T1 t1, T2 t2, std::size_t n, T3... t3)
我第一次尝试使用 lambda 函数,它能够捕获可变参数。它使用 C++11 功能通过 clang 编译。
template<typename T1, typename T2, typename... T3>
void parallel_func(T1 t1, T2 t2, std::size_t n, T3 t3...){
range r(n);
apply_func = [=](range r){ //clang 6.1 can catch t3... here, gcc 4.8.3 could not
std::size_t offset = r.begin();
std::size_t n = r.end() -r.begin();
func(t1, t2, n, (t3+offset)...);
};
tbb::parallel_for(r, apply_func);
}
但是,我使用的集群没有编译器来支持这个特性。我不得不放弃 lambda 函数并编写一个 class 并将其传递给 parallel_for
函数。
我试过了:
template<typename T1, typename T2, typename... T3>
class ApplyFunc{
ApplyFunc(T1 t1, T2 t2, T3... t3){
t1_ = t1;
t2_ = t2;
t3_ = t3...;
}
void operator(range r){
std::size_t offset = r.begin();
std::size_t n = r.end() -r.begin();
func(T1, T2, n, (T3+offset)...);
}
private:
T1 t1_;
T2 t2_;
T3... t3_;
}
显然,不支持可变变量。我试过
std::tuple t3_;
但是,我无法将 std::tuple<T3...>
转换回可变参数。
您可以使用 std::tuple<Ts...>
来保存可变值,并为此目的使用 the indices trick. C++14 Standard Library provides std::index_sequence
扩展它以进行函数调用。
#include <tuple>
// forward compatibility for C++14 Standard Library
namespace cxx14 {
template<std::size_t...> struct index_sequence{};
template<std::size_t N, std::size_t... Is>
struct make_index_sequence : make_index_sequence<N-1, N-1, Is...>{};
template<std::size_t... Is>
struct make_index_sequence<0, Is...> : index_sequence<Is...>{};
}
template<typename T1, typename T2, typename... Ts>
class ApplyFunc{
public:
ApplyFunc(T1 t1, T2 t2, Ts... ts)
: t1_(t1), t2_(t2), pack_(ts...) {}
template<std::size_t... Is>
void call(range r, cxx14::index_sequence<Is...>){
std::size_t offset = r.begin();
std::size_t n = r.end() - r.begin();
func(t1_, t2_, n, (std::get<Is>(pack_)+offset)...);
}
void operator()(range r){
call(r, cxx14::make_index_sequence<sizeof...(Ts)>());
}
private:
T1 t1_;
T2 t2_;
std::tuple<Ts...> pack_;
};