pow 在 CUDA 的 __device__ 函数中无法正常工作
pow is not working properly inside a __device__ function in CUDA
我正在尝试使用 Visual Studio 2019 在 CUDA 的 __device__
函数中使用函数 pow
。
__device__ double Len(double a, double b)
{
return pow(a, 2) + pow(b, 2);
}
但是,当我尝试构建解决方案时,它一直给我这个错误。
Error Undefined reference to '_Z3powdi' in 'x64/Debug/kernel.cu.obj'
只有我把2
改成2.0
才有效。我认为这可能是使用非整数值作为其参数的函数的正确格式,但是当我在普通的 C++ 代码中尝试它时,它可以正常使用整数 2
.
出现这个问题的原因是什么?我该如何解决?
备注:
- 前几天还正常,这个错误应该是最近更新Visual Studio2019,版本16.8.0后出现的。
- 我尝试添加
#include <math.h>
并删除它,但它给出了同样的错误。
CUDA 在设备代码中支持 pow (double, int)
,因为在 2008 年左右添加了适当的双精度支持。这是一个必需的函数,因为至少 C++98 标准(ISO/IEC 14882 第 26.5 节) ).这是一个包含 OP 函数的完整示例程序,为简洁起见省略了错误检查:
#include <stdio.h>
#include <stdlib.h>
#include <math.h>
__device__ double Len(double a, double b)
{
return pow(a, 2) + pow(b, 2);
}
__global__ void kernel (double a, double b)
{
printf ("len = %23.16e\n", Len(a, b));
}
int main (void)
{
kernel<<<1,1>>>(3,4);
cudaDeviceSynchronize();
return EXIT_SUCCESS;
}
这在
上编译没有错误
CUDA 9.2 与 MSVS 2010 (Microsoft (R) C/C++ Optimizing Compiler Version 16.00.40219.01 for x64
) 在 Windows 7
CUDA 11.1 与 MSVS 2019 (Microsoft (R) C/C++ Optimizing Compiler Version 19.27.29112 for x64
) Windows 10
我为发布和调试版本编译如下(用于调试版本的花括号中的参数):
nvcc -o pow_dbl_int.exe {-g -G} pow_dbl_int.cu
运行 时的可执行文件产生此输出:
len = 2.5000000000000000e+01
如果此示例程序无法如图所示使用命令行正确编译,我会怀疑 MSVS 安装或 CUDA 安装出现问题。在我的实践中,我发现通常先安装 MSVS 再安装 CUDA 是有益的,这样 CUDA 可以在安装时正确地集成到 MSVS 中。
由于 OP 显然安装了几天前才在 November 10, 2020 上发布的 MSVS 版本,因此主机编译器头文件和 CUDA 头文件之间也有可能不兼容,这是CUDA 历来对受支持的主机编译器版本进行严格检查的原因(不确定现在是否这样做)。我注意到微软已经发布了 MSVS 2019 16.8.1,发布日期为 2020 年 11 月 12 日。
如多条评论和 CUDA Best Practices Guide 中所述,平方更容易通过乘法完成,并且无需调用 pow()
。
更新:我把pow(float)
都改成了powf(float)
,问题解决了。如果你可以修改代码,我建议修改它们而不是坚持旧版本。
我的 cuda 项目在 VS 16.8 更新后也遇到了一些奇怪的构建问题。回滚到 16.7.8 后问题已解决。
注:我不是C++开发者,如果我说的是废话,或者我的解决方案不好,请见谅。
在我们的 C++/CLI 项目中将 MSVC C++ 工具集更新到 v142 (19.28) 后,我们遇到了同样的问题。该问题仅在运行时调用 Optix 函数时出现。
我们的 kernel.cu 从 CUDA Math API 调用了不存在的函数,尽管智能感知提示它正在调用标准库函数。我不知道发生了什么或为什么,但现在可以了。
在 CUDA Math API 中,有 2 个 pow 函数:
- double pow (double x, double y)
- 浮动 powf(浮动 x,浮动 y)
我所做的只是简单地将我的整数转换为双倍 (static_cast<double>(3)
),然后在另一个带有浮点参数的调用中,将调用从 pow 更改为 powf .
我正在尝试使用 Visual Studio 2019 在 CUDA 的 __device__
函数中使用函数 pow
。
__device__ double Len(double a, double b)
{
return pow(a, 2) + pow(b, 2);
}
但是,当我尝试构建解决方案时,它一直给我这个错误。
Error Undefined reference to '_Z3powdi' in 'x64/Debug/kernel.cu.obj'
只有我把2
改成2.0
才有效。我认为这可能是使用非整数值作为其参数的函数的正确格式,但是当我在普通的 C++ 代码中尝试它时,它可以正常使用整数 2
.
出现这个问题的原因是什么?我该如何解决?
备注:
- 前几天还正常,这个错误应该是最近更新Visual Studio2019,版本16.8.0后出现的。
- 我尝试添加
#include <math.h>
并删除它,但它给出了同样的错误。
CUDA 在设备代码中支持 pow (double, int)
,因为在 2008 年左右添加了适当的双精度支持。这是一个必需的函数,因为至少 C++98 标准(ISO/IEC 14882 第 26.5 节) ).这是一个包含 OP 函数的完整示例程序,为简洁起见省略了错误检查:
#include <stdio.h>
#include <stdlib.h>
#include <math.h>
__device__ double Len(double a, double b)
{
return pow(a, 2) + pow(b, 2);
}
__global__ void kernel (double a, double b)
{
printf ("len = %23.16e\n", Len(a, b));
}
int main (void)
{
kernel<<<1,1>>>(3,4);
cudaDeviceSynchronize();
return EXIT_SUCCESS;
}
这在
上编译没有错误CUDA 9.2 与 MSVS 2010 (
Microsoft (R) C/C++ Optimizing Compiler Version 16.00.40219.01 for x64
) 在 Windows 7CUDA 11.1 与 MSVS 2019 (
Microsoft (R) C/C++ Optimizing Compiler Version 19.27.29112 for x64
) Windows 10
我为发布和调试版本编译如下(用于调试版本的花括号中的参数):
nvcc -o pow_dbl_int.exe {-g -G} pow_dbl_int.cu
运行 时的可执行文件产生此输出:
len = 2.5000000000000000e+01
如果此示例程序无法如图所示使用命令行正确编译,我会怀疑 MSVS 安装或 CUDA 安装出现问题。在我的实践中,我发现通常先安装 MSVS 再安装 CUDA 是有益的,这样 CUDA 可以在安装时正确地集成到 MSVS 中。
由于 OP 显然安装了几天前才在 November 10, 2020 上发布的 MSVS 版本,因此主机编译器头文件和 CUDA 头文件之间也有可能不兼容,这是CUDA 历来对受支持的主机编译器版本进行严格检查的原因(不确定现在是否这样做)。我注意到微软已经发布了 MSVS 2019 16.8.1,发布日期为 2020 年 11 月 12 日。
如多条评论和 CUDA Best Practices Guide 中所述,平方更容易通过乘法完成,并且无需调用 pow()
。
更新:我把pow(float)
都改成了powf(float)
,问题解决了。如果你可以修改代码,我建议修改它们而不是坚持旧版本。
我的 cuda 项目在 VS 16.8 更新后也遇到了一些奇怪的构建问题。回滚到 16.7.8 后问题已解决。
注:我不是C++开发者,如果我说的是废话,或者我的解决方案不好,请见谅。
在我们的 C++/CLI 项目中将 MSVC C++ 工具集更新到 v142 (19.28) 后,我们遇到了同样的问题。该问题仅在运行时调用 Optix 函数时出现。
我们的 kernel.cu 从 CUDA Math API 调用了不存在的函数,尽管智能感知提示它正在调用标准库函数。我不知道发生了什么或为什么,但现在可以了。
在 CUDA Math API 中,有 2 个 pow 函数:
- double pow (double x, double y)
- 浮动 powf(浮动 x,浮动 y)
我所做的只是简单地将我的整数转换为双倍 (static_cast<double>(3)
),然后在另一个带有浮点参数的调用中,将调用从 pow 更改为 powf .