OpenMP 运行时看不到我的 GPU 设备
OpenMP runtime does not sees my GPU devices
我正在尝试将一些 OpenMP 卸载到我使用 GTX 1060 显卡的本地机器上的 GPU。我所有的 CUDA 和 Cublas 示例 运行 都很好。但是,当我尝试 运行 某些 OpenMP 卸载时,它根本不起作用。为了支持 OpenMP 5.0,我编译了 GCC 10.2.0 工具链。经过一番调试,我发现OpenMP运行时候没有看到任何设备。例如。此代码显示零:
#include <omp.h>
#include <stdio.h>
int main() {
printf("%d\n", omp_get_num_devices());
return 0;
}
但是,Nvidia 工具链已经启动并且 运行ning:
$ nvidia-smi
Sun Feb 21 23:06:40 2021
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 450.51.06 Driver Version: 450.51.06 CUDA Version: 11.0 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|===============================+======================+======================|
| 0 GeForce GTX 106... Off | 00000000:1D:00.0 Off | N/A |
| 0% 37C P8 12W / 200W | 584MiB / 6075MiB | 0% Default |
| | | N/A |
+-------------------------------+----------------------+----------------------+
那我错过了什么? OpenMP 运行时间如何找到设备?
编辑:
我正在附加有关我的编译器的信息:
$ gcc -v
Using built-in specs.
COLLECT_GCC=gcc
COLLECT_LTO_WRAPPER=/opt/gcc/10.2.0/libexec/gcc/x86_64-pc-linux-gnu/10.2.0/lto-wrapper
Target: x86_64-pc-linux-gnu
Configured with: ./configure --prefix=/opt/gcc/10.2.0/
Thread model: posix
Supported LTO compression algorithms: zlib
gcc version 10.2.0 (GCC)
代码是使用以下命令编译的:
gcc -fopenmp simple.c
要编译支持卸载的 OpenMP 代码,您需要告诉 GCC 确切的目标平台。这是通过 -foffload=<platform>
命令行选项实现的。对于 NVIDIA 设备,平台是 nvptx-none
,即,您必须使用:
进行编译
gcc -fopenmp -foffload=nvidia-ptx simple.c
尽管 GCC 支持卸载到多个目标平台,但由于需要依赖性,并非每个 GCC 发行版都启用它们。例如,在我的 Arch Linux 上,GCC 根本没有编译支持卸载。如果您在执行上一个命令时收到错误消息,则说明您的 GCC 未配置为支持 NVIDIA。 gcc -v
向您展示编译器的配置方式等。在配置选项中查找 --enable-offload-targets=nvptx-none
。
GCC wiki 上的 Offloading page 提供了有关支持的卸载目标以及如何构建它们的更多详细信息。
我正在尝试将一些 OpenMP 卸载到我使用 GTX 1060 显卡的本地机器上的 GPU。我所有的 CUDA 和 Cublas 示例 运行 都很好。但是,当我尝试 运行 某些 OpenMP 卸载时,它根本不起作用。为了支持 OpenMP 5.0,我编译了 GCC 10.2.0 工具链。经过一番调试,我发现OpenMP运行时候没有看到任何设备。例如。此代码显示零:
#include <omp.h>
#include <stdio.h>
int main() {
printf("%d\n", omp_get_num_devices());
return 0;
}
但是,Nvidia 工具链已经启动并且 运行ning:
$ nvidia-smi
Sun Feb 21 23:06:40 2021
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 450.51.06 Driver Version: 450.51.06 CUDA Version: 11.0 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|===============================+======================+======================|
| 0 GeForce GTX 106... Off | 00000000:1D:00.0 Off | N/A |
| 0% 37C P8 12W / 200W | 584MiB / 6075MiB | 0% Default |
| | | N/A |
+-------------------------------+----------------------+----------------------+
那我错过了什么? OpenMP 运行时间如何找到设备?
编辑:
我正在附加有关我的编译器的信息:
$ gcc -v
Using built-in specs.
COLLECT_GCC=gcc
COLLECT_LTO_WRAPPER=/opt/gcc/10.2.0/libexec/gcc/x86_64-pc-linux-gnu/10.2.0/lto-wrapper
Target: x86_64-pc-linux-gnu
Configured with: ./configure --prefix=/opt/gcc/10.2.0/
Thread model: posix
Supported LTO compression algorithms: zlib
gcc version 10.2.0 (GCC)
代码是使用以下命令编译的:
gcc -fopenmp simple.c
要编译支持卸载的 OpenMP 代码,您需要告诉 GCC 确切的目标平台。这是通过 -foffload=<platform>
命令行选项实现的。对于 NVIDIA 设备,平台是 nvptx-none
,即,您必须使用:
gcc -fopenmp -foffload=nvidia-ptx simple.c
尽管 GCC 支持卸载到多个目标平台,但由于需要依赖性,并非每个 GCC 发行版都启用它们。例如,在我的 Arch Linux 上,GCC 根本没有编译支持卸载。如果您在执行上一个命令时收到错误消息,则说明您的 GCC 未配置为支持 NVIDIA。 gcc -v
向您展示编译器的配置方式等。在配置选项中查找 --enable-offload-targets=nvptx-none
。
GCC wiki 上的 Offloading page 提供了有关支持的卸载目标以及如何构建它们的更多详细信息。