如何让 CMake 自动检测 CUDA_ARCHITECTURES 的值?
How can I get CMake to automatically detect the value for CUDA_ARCHITECTURES?
较新版本的 CMake(3.18 及更高版本)“知道”选择 CUDA 代码编译目标的 CUDA 体系结构。目标有一个 CUDA_ARCHITECTURES
属性,设置后会为您生成适当的 -gencode arch=whatever,code=whatever
编译选项。如果您不设置此值,您甚至会收到警告:
CMake Error in CMakeLists.txt:
CUDA_ARCHITECTURES is empty for target "my_cuda_app".
默认情况下,此目标 属性 被初始化为 CMAKE_CUDA_ARCHITECTURES
。但是 CMAKE_CUDA_ARCHITECTURES
本身没有初始化为任何东西 (!)
我们如何让 CMake 自动检测 CUDA_ARCHITECTURES
或全局 CMAKD_CUDA_ARCHITECTURES
的适当值?即使用系统上安装的GPU的架构?
CMake 实际上提供了这种自动检测功能,但是:
- 它没有记录(并且可能会在将来的某个时候重构)。
- 它是已弃用的 FindCUDA 机制的一部分,适用于直接操作
CUDA_CMAKE_FLAGS
(这不是我们想要的)。
- 它并不“很好玩”,并且对我们隐藏了有用形式的内部变量。
不过,只要稍加努力,我们就能让它发挥作用。
首先,它的位置:它在一个模块中,FindCUDA/select_compute_arch
(在 Linux 系统上,将位于 /path/to/cmake/root/share/cmake-X.YY/Modules/FindCUDA/select_compute_arch.cmake
)。
下面是您的使用方法:
include(FindCUDA/select_compute_arch)
CUDA_DETECT_INSTALLED_GPUS(INSTALLED_GPU_CCS_1)
string(STRIP "${INSTALLED_GPU_CCS_1}" INSTALLED_GPU_CCS_2)
string(REPLACE " " ";" INSTALLED_GPU_CCS_3 "${INSTALLED_GPU_CCS_2}")
string(REPLACE "." "" CUDA_ARCH_LIST "${INSTALLED_GPU_CCS_3}")
SET(CMAKE_CUDA_ARCHITECTURES ${CUDA_ARCH_LIST})
如果您只想将此用于单个目标,您可以将最后一行替换为:
set_property(TARGET my_target PROPERTY "${CUDA_ARCH_LIST}")
备注:
当您的系统上没有 个 GPU 时,您可能会得到如下结果:3.5;5.0;5.3;6.0;6.1;7.0;7.5;7.5+PTX
.
这是一个 issue with CMake which will not be resolved,因为我们在这里使用的子模块不受官方支持。因此,如果您需要在没有 GPU 的系统上编译,请避免此调用或解析您的结果以获得“+PTX”条目。
select_compute_arch
子模块已经存在了很长时间,但在过去您会以不同的方式使用它,并且会通过 include(FindCUDA)
.
包含它
不知道LIST(APPEND CMAKE_CUDA_ARCHITECTURES
会不会比SET(CMAKE_CUDA_ARCHITECTURES
更合适。
请参阅 CMake 问题 22375 and 19199,了解 CMake 将来可能会在哪些方面进行处理。警告:我提交了那些错误...
我在使用 CMake 3.13 系统的其他解决方案时遇到问题,不确定它是什么,但我不得不使用它。
可能有更好的方法。
if(${CMAKE_VERSION} VERSION_LESS_EQUAL "3.13.4")
cuda_select_nvcc_arch_flags(ARCH_FLAGS "Auto") # optional argument for arch to add
message("ARCH_FLAGS = ${ARCH_FLAGS}")
string(REPLACE "-gencode;" "--generate-code=" ARCH_FLAGS "${ARCH_FLAGS}")
string(APPEND CMAKE_CUDA_FLAGS "${ARCH_FLAGS}")
else()
include(FindCUDA/select_compute_arch)
CUDA_DETECT_INSTALLED_GPUS(INSTALLED_GPU_CCS_1)
string(STRIP "${INSTALLED_GPU_CCS_1}" INSTALLED_GPU_CCS_2)
string(REPLACE " " ";" INSTALLED_GPU_CCS_3 "${INSTALLED_GPU_CCS_2}")
string(REPLACE "." "" CUDA_ARCH_LIST "${INSTALLED_GPU_CCS_3}")
SET(CMAKE_CUDA_ARCHITECTURES ${CUDA_ARCH_LIST})
set_property(GLOBAL PROPERTY CUDA_ARCHITECTURES "${CUDA_ARCH_LIST}")
endif()
在即将发布的 CMake 3.24 中,您将可以编写:
set_property(TARGET tgt PROPERTY CUDA_ARCHITECTURES native)
这将为配置时系统上可用的 GPU 的(具体)CUDA 架构构建目标 tgt
。
对于较新版本的 CUDA(11.5 及更高版本),会将 native
传递给 nvcc 和其他可执行文件;对于旧版本,它将auto-detect哪些架构是'native'。
较新版本的 CMake(3.18 及更高版本)“知道”选择 CUDA 代码编译目标的 CUDA 体系结构。目标有一个 CUDA_ARCHITECTURES
属性,设置后会为您生成适当的 -gencode arch=whatever,code=whatever
编译选项。如果您不设置此值,您甚至会收到警告:
CMake Error in CMakeLists.txt:
CUDA_ARCHITECTURES is empty for target "my_cuda_app".
默认情况下,此目标 属性 被初始化为 CMAKE_CUDA_ARCHITECTURES
。但是 CMAKE_CUDA_ARCHITECTURES
本身没有初始化为任何东西 (!)
我们如何让 CMake 自动检测 CUDA_ARCHITECTURES
或全局 CMAKD_CUDA_ARCHITECTURES
的适当值?即使用系统上安装的GPU的架构?
CMake 实际上提供了这种自动检测功能,但是:
- 它没有记录(并且可能会在将来的某个时候重构)。
- 它是已弃用的 FindCUDA 机制的一部分,适用于直接操作
CUDA_CMAKE_FLAGS
(这不是我们想要的)。 - 它并不“很好玩”,并且对我们隐藏了有用形式的内部变量。
不过,只要稍加努力,我们就能让它发挥作用。
首先,它的位置:它在一个模块中,FindCUDA/select_compute_arch
(在 Linux 系统上,将位于 /path/to/cmake/root/share/cmake-X.YY/Modules/FindCUDA/select_compute_arch.cmake
)。
下面是您的使用方法:
include(FindCUDA/select_compute_arch)
CUDA_DETECT_INSTALLED_GPUS(INSTALLED_GPU_CCS_1)
string(STRIP "${INSTALLED_GPU_CCS_1}" INSTALLED_GPU_CCS_2)
string(REPLACE " " ";" INSTALLED_GPU_CCS_3 "${INSTALLED_GPU_CCS_2}")
string(REPLACE "." "" CUDA_ARCH_LIST "${INSTALLED_GPU_CCS_3}")
SET(CMAKE_CUDA_ARCHITECTURES ${CUDA_ARCH_LIST})
如果您只想将此用于单个目标,您可以将最后一行替换为:
set_property(TARGET my_target PROPERTY "${CUDA_ARCH_LIST}")
备注:
当您的系统上没有 个 GPU 时,您可能会得到如下结果:
3.5;5.0;5.3;6.0;6.1;7.0;7.5;7.5+PTX
.这是一个 issue with CMake which will not be resolved,因为我们在这里使用的子模块不受官方支持。因此,如果您需要在没有 GPU 的系统上编译,请避免此调用或解析您的结果以获得“+PTX”条目。
包含它select_compute_arch
子模块已经存在了很长时间,但在过去您会以不同的方式使用它,并且会通过include(FindCUDA)
.不知道
LIST(APPEND CMAKE_CUDA_ARCHITECTURES
会不会比SET(CMAKE_CUDA_ARCHITECTURES
更合适。请参阅 CMake 问题 22375 and 19199,了解 CMake 将来可能会在哪些方面进行处理。警告:我提交了那些错误...
我在使用 CMake 3.13 系统的其他解决方案时遇到问题,不确定它是什么,但我不得不使用它。
可能有更好的方法。
if(${CMAKE_VERSION} VERSION_LESS_EQUAL "3.13.4")
cuda_select_nvcc_arch_flags(ARCH_FLAGS "Auto") # optional argument for arch to add
message("ARCH_FLAGS = ${ARCH_FLAGS}")
string(REPLACE "-gencode;" "--generate-code=" ARCH_FLAGS "${ARCH_FLAGS}")
string(APPEND CMAKE_CUDA_FLAGS "${ARCH_FLAGS}")
else()
include(FindCUDA/select_compute_arch)
CUDA_DETECT_INSTALLED_GPUS(INSTALLED_GPU_CCS_1)
string(STRIP "${INSTALLED_GPU_CCS_1}" INSTALLED_GPU_CCS_2)
string(REPLACE " " ";" INSTALLED_GPU_CCS_3 "${INSTALLED_GPU_CCS_2}")
string(REPLACE "." "" CUDA_ARCH_LIST "${INSTALLED_GPU_CCS_3}")
SET(CMAKE_CUDA_ARCHITECTURES ${CUDA_ARCH_LIST})
set_property(GLOBAL PROPERTY CUDA_ARCHITECTURES "${CUDA_ARCH_LIST}")
endif()
在即将发布的 CMake 3.24 中,您将可以编写:
set_property(TARGET tgt PROPERTY CUDA_ARCHITECTURES native)
这将为配置时系统上可用的 GPU 的(具体)CUDA 架构构建目标 tgt
。
对于较新版本的 CUDA(11.5 及更高版本),会将 native
传递给 nvcc 和其他可执行文件;对于旧版本,它将auto-detect哪些架构是'native'。