LLVM 编译器支持的 CUDA 编译的最小计算能力是多少?

What is the minimum compute capability for CUDA compilation supported by LLVM compiler?

CUDA 源文件可以使用 LLVM 编译器和命令 clang -Xclang -I$LIBCLC/include/generic -I$LIBCLC/include/ptx -Dcl_clang_storage_class_specifiers -O3 cudaFile.cu -S -o ptxOutputFile.ptx --cuda-gpu-arch=sm_XX

编译成 PTX 格式

其中sm_XX可以替换为sm_20、sm_30。对于计算能力 1.0,当 sm_XX 替换为 sm_10 时,会出现错误 fatal error: cannot open file '/tmp/shared-25f2f5.s': No such file or directory 1 error generated.

看来 LLVM 的最小计算能力为 2.0。这个假设是否正确?

应该是正确的。从 CUDA 7.0 开始,对 sm_1x 的工具包和驱动程序支持都已停止。如果 sm_20 有效,它必须是最小值。

CUDA Toolkit and CUDA Driver Support for Tesla Architecture The CUDA Toolkit and CUDA Driver no longer supports the sm_10, sm_11, sm_12, and sm_13 architectures. As a consequence, CU_TARGET_COMPUTE_1x enum values have been removed from the CUDA headers.

http://developer.download.nvidia.com/compute/cuda/7_0/Prod/doc/CUDA_Toolkit_Release_Notes.pdf