您如何构建示例 CUDA Thrust 设备排序?
How do you build the example CUDA Thrust device sort?
我正在尝试使用最新版本 (7.0) 的 CUDA 和随附的 THURST 安装在 Visual Studio 2010 中构建和 运行 Thrust 示例代码。我无法获取示例代码来构建和 运行。
通过删除部分代码,我发现问题出在 thrust::sort(..) 调用上。主机向量运行良好,但设备向量会产生以下编译错误:
1>c:\program files\nvidia gpu 计算 toolkit\cuda\v7.0\include\thrust\system\cuda\detail\sort.inl(203): 错误 C2027: 使用未定义类型 'thrust::detail::STATIC_ASSERTION_FAILURE'
这是我正在使用的无法编译的示例代码,它主要来自 https://developer.nvidia.com/Thrust
的 CUDA 信任示例
#include <thrust/host_vector.h>
#include <thrust/device_vector.h>
#include <thrust/generate.h>
#include <thrust/sort.h>
#include <thrust/copy.h>
#include <algorithm>
#include <cstdlib>
#include <time.h>
int main(void)
{
// generate 32M random numbers serially
thrust::host_vector<int> h_vec(32 << 20);
std::generate(h_vec.begin(), h_vec.end(), rand);
// transfer data to the device
thrust::device_vector<int> d_vec = h_vec;
// sort data on the device (This breaks the compile)
thrust::sort(d_vec.begin(), d_vec.end());
// sort data on the host (This works just fine)
thrust::sort(h_vec.begin(), d_vec.end());
// transfer data back to host
thrust::copy(d_vec.begin(), d_vec.end(), h_vec.begin());
return 0;
}
四处游玩我发现,如果您注释掉使用设备向量的行:
// thrust::sort(d_vec.begin(), d_vec.end());
但保留使用主向量的行:
thrust::sort(h_vec.begin(), d_vec.end());
它可以编译并且 运行 很好,尽管在主机上排序似乎是 运行ning。
如何获取要编译的示例代码并运行以便在设备向量而不是主机向量上进行排序?
我的系统配置包括:
- Visual Studio 安装 2010/SP1
- Windows 7 专业版,64 位
- CUDA 7.0 开发套件
- 带有最新驱动程序的 NVIDA Quadro K4000
正如@JaredHoberock 所指出的,关键问题可能是您正在尝试编译 .cpp 文件。您需要将该文件重命名为 .cu 并确保它正在由 nvcc 编译。
修复该问题后,您可能 运行 会遇到另一个问题。这是不正确的,不会编译:
thrust::sort(h_vec.begin(), d_vec.end());
这里的第一个参数是要排序的范围的开始,第二个参数是范围的结束。您的第一个参数将范围的开始标识为在主机上,将范围的结尾标识为在设备上。这将触发编译错误。
改为:
thrust::sort(h_vec.begin(), h_vec.end());
你的代码编译成功,运行对我来说是成功的。
在你上面的例子中,这一行是完全没用的。不需要对数据进行排序,而且你在这里覆盖了结果:
thrust::copy(d_vec.begin(), d_vec.end(), h_vec.begin());
(Jared Hoberock 指出将 CW 标记为关键问题)
我正在尝试使用最新版本 (7.0) 的 CUDA 和随附的 THURST 安装在 Visual Studio 2010 中构建和 运行 Thrust 示例代码。我无法获取示例代码来构建和 运行。
通过删除部分代码,我发现问题出在 thrust::sort(..) 调用上。主机向量运行良好,但设备向量会产生以下编译错误:
1>c:\program files\nvidia gpu 计算 toolkit\cuda\v7.0\include\thrust\system\cuda\detail\sort.inl(203): 错误 C2027: 使用未定义类型 'thrust::detail::STATIC_ASSERTION_FAILURE'
这是我正在使用的无法编译的示例代码,它主要来自 https://developer.nvidia.com/Thrust
的 CUDA 信任示例#include <thrust/host_vector.h>
#include <thrust/device_vector.h>
#include <thrust/generate.h>
#include <thrust/sort.h>
#include <thrust/copy.h>
#include <algorithm>
#include <cstdlib>
#include <time.h>
int main(void)
{
// generate 32M random numbers serially
thrust::host_vector<int> h_vec(32 << 20);
std::generate(h_vec.begin(), h_vec.end(), rand);
// transfer data to the device
thrust::device_vector<int> d_vec = h_vec;
// sort data on the device (This breaks the compile)
thrust::sort(d_vec.begin(), d_vec.end());
// sort data on the host (This works just fine)
thrust::sort(h_vec.begin(), d_vec.end());
// transfer data back to host
thrust::copy(d_vec.begin(), d_vec.end(), h_vec.begin());
return 0;
}
四处游玩我发现,如果您注释掉使用设备向量的行:
// thrust::sort(d_vec.begin(), d_vec.end());
但保留使用主向量的行:
thrust::sort(h_vec.begin(), d_vec.end());
它可以编译并且 运行 很好,尽管在主机上排序似乎是 运行ning。
如何获取要编译的示例代码并运行以便在设备向量而不是主机向量上进行排序?
我的系统配置包括:
- Visual Studio 安装 2010/SP1
- Windows 7 专业版,64 位
- CUDA 7.0 开发套件
- 带有最新驱动程序的 NVIDA Quadro K4000
正如@JaredHoberock 所指出的,关键问题可能是您正在尝试编译 .cpp 文件。您需要将该文件重命名为 .cu 并确保它正在由 nvcc 编译。
修复该问题后,您可能 运行 会遇到另一个问题。这是不正确的,不会编译:
thrust::sort(h_vec.begin(), d_vec.end());
这里的第一个参数是要排序的范围的开始,第二个参数是范围的结束。您的第一个参数将范围的开始标识为在主机上,将范围的结尾标识为在设备上。这将触发编译错误。
改为:
thrust::sort(h_vec.begin(), h_vec.end());
你的代码编译成功,运行对我来说是成功的。
在你上面的例子中,这一行是完全没用的。不需要对数据进行排序,而且你在这里覆盖了结果:
thrust::copy(d_vec.begin(), d_vec.end(), h_vec.begin());
(Jared Hoberock 指出将 CW 标记为关键问题)