如何将 std::vector<thrust::device_vector<int>> 转换为 int**?
How do I convert a std::vector<thrust::device_vector<int>> to int**?
我正在开发一个应用程序,在该应用程序中,先前的处理已经生成了一个(短但可变长度)std::vector
个(大)thrust::device_vector
s,每个都具有相同的长度(但那个长度也是可变的)。我需要将其转换为设备上的原始指针以将其传递给 cuda 内核。
我做了下面的过程,据我所知应该将 rawNumberSquare
作为设备上的指针,rawNumberSquare[0]
和 rawNumberSquare[1]
每个都包含一个指向 numberSquareOnDevice[0][0]
和 numberSquareOnDevice[1][0]
分别。所以,在我看来 rawNumberSquare[i][j]
(i,j = 0,1) 都是这个程序分配的位置,可以合法访问。
然而,当内核试图访问这些位置时,值是错误的,并且程序因非法内存访问而崩溃。
#include "cuda_runtime.h"
#include "device_launch_parameters.h"
#include <stdio.h>
#include<vector>
#include<thrust/device_vector.h>
__global__ void talkKernel( int ** in, int dimension)
{
int index = threadIdx.x;
for (int coord = 0; coord < dimension; ++coord)
printf("in[%d][%d] = %d\n", coord, index, in[coord][index]);
}
int main()
{
//print out name of GPU in case it is helpful
int deviceNumber;
cudaGetDevice(&deviceNumber);
cudaDeviceProp prop;
cudaGetDeviceProperties(&prop, deviceNumber);
std::cout << prop.name << "\n";
//make a std::vector of std::vectors of ints
std::vector<std::vector<int>> numberSquareOnHost{ {1,2}, {3,4} };
//copy the values of each vector to the device
std::vector<thrust::device_vector<int>> numberSquareDevice;
for (auto& vector : numberSquareOnHost)
numberSquareDevice.push_back(thrust::device_vector<int>(vector));
//copy the raw pointers to start of the device vectors to a std::vector
std::vector<int*> halfRawNumberSquareOnHost(2);
for ( int i = 0; i < 2 ; ++i)
halfRawNumberSquareOnHost[i] = (thrust::raw_pointer_cast(numberSquareOnHost[i].data()));
//copy the raw pointers ot the device
thrust::device_vector<int*> halfRawNumberSquareOnDevice(halfRawNumberSquareOnHost);
//get raw pointer (on the device) to the raw pointers (on the device)
int** rawNumberSquare = thrust::raw_pointer_cast(halfRawNumberSquareOnDevice.data());
//call the kernel
talkKernel <<<1,2 >>> ( rawNumberSquare, 2);
cudaDeviceSynchronize();
//ask what's up'
std::cout << cudaGetErrorString(cudaGetLastError()) << "\n";
return 0;
/*output:
* Quadro M2200
in[0][0] = 0
in[0][1] = 0
in[1][0] = 0
in[1][1] = 0
an illegal memory access was encountered
...\vectorOfVectors.exe (process 6428) exited with code -1073740791.
*/
}
我还尝试了所有方法,例如使用 new
分配主机指针到(原始设备)int*
而不是使用 std::vector<int*> halfRawNumberSquareOnHost
并分配设备 int** rawSquareOnDevice
cudaMalloc
(并用 cudaMemcpy
填充)。这没有什么不同。
你的错误在这里:
halfRawNumberSquareOnHost[i] = (thrust::raw_pointer_cast(numberSquareOnHost[i].data()));
应该是:
halfRawNumberSquareOnHost[i] = (thrust::raw_pointer_cast(numberSquareDevice[i].data()));
第一个是获取主机指针(这不是你想要的。)第二个是获取设备指针。换句话说,您构建 numberSquareDevice
是有原因的,但您发布的代码实际上并未使用它。
我正在开发一个应用程序,在该应用程序中,先前的处理已经生成了一个(短但可变长度)std::vector
个(大)thrust::device_vector
s,每个都具有相同的长度(但那个长度也是可变的)。我需要将其转换为设备上的原始指针以将其传递给 cuda 内核。
我做了下面的过程,据我所知应该将 rawNumberSquare
作为设备上的指针,rawNumberSquare[0]
和 rawNumberSquare[1]
每个都包含一个指向 numberSquareOnDevice[0][0]
和 numberSquareOnDevice[1][0]
分别。所以,在我看来 rawNumberSquare[i][j]
(i,j = 0,1) 都是这个程序分配的位置,可以合法访问。
然而,当内核试图访问这些位置时,值是错误的,并且程序因非法内存访问而崩溃。
#include "cuda_runtime.h"
#include "device_launch_parameters.h"
#include <stdio.h>
#include<vector>
#include<thrust/device_vector.h>
__global__ void talkKernel( int ** in, int dimension)
{
int index = threadIdx.x;
for (int coord = 0; coord < dimension; ++coord)
printf("in[%d][%d] = %d\n", coord, index, in[coord][index]);
}
int main()
{
//print out name of GPU in case it is helpful
int deviceNumber;
cudaGetDevice(&deviceNumber);
cudaDeviceProp prop;
cudaGetDeviceProperties(&prop, deviceNumber);
std::cout << prop.name << "\n";
//make a std::vector of std::vectors of ints
std::vector<std::vector<int>> numberSquareOnHost{ {1,2}, {3,4} };
//copy the values of each vector to the device
std::vector<thrust::device_vector<int>> numberSquareDevice;
for (auto& vector : numberSquareOnHost)
numberSquareDevice.push_back(thrust::device_vector<int>(vector));
//copy the raw pointers to start of the device vectors to a std::vector
std::vector<int*> halfRawNumberSquareOnHost(2);
for ( int i = 0; i < 2 ; ++i)
halfRawNumberSquareOnHost[i] = (thrust::raw_pointer_cast(numberSquareOnHost[i].data()));
//copy the raw pointers ot the device
thrust::device_vector<int*> halfRawNumberSquareOnDevice(halfRawNumberSquareOnHost);
//get raw pointer (on the device) to the raw pointers (on the device)
int** rawNumberSquare = thrust::raw_pointer_cast(halfRawNumberSquareOnDevice.data());
//call the kernel
talkKernel <<<1,2 >>> ( rawNumberSquare, 2);
cudaDeviceSynchronize();
//ask what's up'
std::cout << cudaGetErrorString(cudaGetLastError()) << "\n";
return 0;
/*output:
* Quadro M2200
in[0][0] = 0
in[0][1] = 0
in[1][0] = 0
in[1][1] = 0
an illegal memory access was encountered
...\vectorOfVectors.exe (process 6428) exited with code -1073740791.
*/
}
我还尝试了所有方法,例如使用 new
分配主机指针到(原始设备)int*
而不是使用 std::vector<int*> halfRawNumberSquareOnHost
并分配设备 int** rawSquareOnDevice
cudaMalloc
(并用 cudaMemcpy
填充)。这没有什么不同。
你的错误在这里:
halfRawNumberSquareOnHost[i] = (thrust::raw_pointer_cast(numberSquareOnHost[i].data()));
应该是:
halfRawNumberSquareOnHost[i] = (thrust::raw_pointer_cast(numberSquareDevice[i].data()));
第一个是获取主机指针(这不是你想要的。)第二个是获取设备指针。换句话说,您构建 numberSquareDevice
是有原因的,但您发布的代码实际上并未使用它。