无法加载动态库 'libnvinfer.so.6'

Could not load dynamic library 'libnvinfer.so.6'

我正尝试正常导入 TensorFlow python 包,但出现以下错误:

以上终端图片中的文字如下:

2020-02-23 19:01:06.163940: W tensorflow/stream_executor/platform/default/dso_loader.cc:55] Could not load dynamic library 'libnvinfer.so.6'; dlerror: libnvinfer.so.6: cannot open shared object file: No such file or directory
2020-02-23 19:01:06.164019: W tensorflow/stream_executor/platform/default/dso_loader.cc:55] Could not load dynamic library 'libnvinfer_plugin.so.6'; dlerror: libnvinfer_plugin.so.6: cannot open shared object file: No such file or directory
2020-02-23 19:01:06.164030: W tensorflow/compiler/tf2tensorrt/utils/py_utils.cc:30] Cannot dlopen some TensorRT libraries. If you would like to use Nvidia GPU with TensorRT, please make sure the missing libraries mentioned above are installed properly.
<module 'tensorflow_core._api.v2.version' from '/home/saman/miniconda3/envs/testconda/lib/python3.7/site-packages/tensorflow_core/_api/v2/version/__init__.py'

这是警告,不是错误。您仍然可以使用 TensorFlow。共享库 libnvinferlibnvinfer_plugin 是可选的,仅当您使用 nvidia 的 TensorRT 功能时才需要。

TensorFlow's installation instructions 列出 GPU 依赖项:

The following NVIDIA® software must be installed on your system:

  • NVIDIA® GPU drivers —CUDA 10.1 requires 418.x or higher.
  • CUDA® Toolkit —TensorFlow supports CUDA 10.1 (TensorFlow >= 2.1.0)
  • CUPTI ships with the CUDA Toolkit.
  • cuDNN SDK (>= 7.6)
  • (Optional) TensorRT 6.0 to improve latency and throughput for inference on some models.

您可以使用以下命令(取自 TensorFlow documentation)在 Ubuntu 18.04 上安装它们:

# Add NVIDIA package repositories
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/cuda-repo-ubuntu1804_10.1.243-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu1804_10.1.243-1_amd64.deb
sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/7fa2af80.pub
sudo apt-get update
wget http://developer.download.nvidia.com/compute/machine-learning/repos/ubuntu1804/x86_64/nvidia-machine-learning-repo-ubuntu1804_1.0.0-1_amd64.deb
sudo apt install ./nvidia-machine-learning-repo-ubuntu1804_1.0.0-1_amd64.deb
sudo apt-get update

# Install NVIDIA driver
sudo apt-get install --no-install-recommends nvidia-driver-430
# Reboot. Check that GPUs are visible using the command: nvidia-smi

# Install development and runtime libraries (~4GB)
sudo apt-get install --no-install-recommends \
    cuda-10-1 \
    libcudnn7=7.6.4.38-1+cuda10.1  \
    libcudnn7-dev=7.6.4.38-1+cuda10.1


# Install TensorRT. Requires that libcudnn7 is installed above.
sudo apt-get install -y --no-install-recommends libnvinfer6=6.0.1-1+cuda10.1 \
    libnvinfer-dev=6.0.1-1+cuda10.1 \
    libnvinfer-plugin6=6.0.1-1+cuda10.1

这些消息中的大部分是警告,而不是错误。它们只是意味着未安装使用 Nvidia GPU 的库,但您不必拥有任何 Nvidia GPU 即可使用 Tensorflow,因此您不需要这些库。 jakub 的评论告诉我们如何关闭警告:

export TF_CPP_MIN_LOG_LEVEL="2"

但是,我也是 运行 Tensorflow 没有 Nvidia 的东西,还有一条消息是错误,而不是警告:

2020-04-10 10:04:13.365696: E tensorflow/stream_executor/cuda/cuda_driver.cc:351] failed call to cuInit: UNKNOWN ERROR (303)

应该是无关紧要的,因为它也是指cuda,是Nvidia的。不过这似乎不是致命错误。

由于(意外)更新了 libvnifer6 包,我收到了这个警告。它已更新为 6.0.1-1+cuda10.2,而原始安装使用 6.0.1-1+cuda10.1

在我卸载引用 cuda10.2 并重新 运行

的软件包之后
sudo apt-get install -y --no-install-recommends libnvinfer6=6.0.1-1+cuda10.1 \
    libnvinfer-dev=6.0.1-1+cuda10.1 \
    libnvinfer-plugin6=6.0.1-1+cuda10.1

此警告消失。

您可以下载 tensorRT 6 的 zip 文件,然后将 x86 linux 文件夹文件粘贴到 /usr/lib/cuda 确保您拥有的 x86_linux 文件夹中的 lib 文件夹下载的应该重命名为 lib64 。将 cuda 目录中的所有文件粘贴后重新启动系统。现在 Cuda 和 TensorRT 引擎将 运行 在您的系统中顺利运行。

我花了大约 5 个小时来解决这个问题。对于我的情况,我认为这意味着您的库版本错误。 libnvinfer.so.6 位于 'TensorRT-*/lib',数字 6 表示 tensorFlow 正在寻找 TensorRT6 的 libvinfer。因此,如果它是“无法加载动态库 libnvinfer.so.5”,则意味着您需要 TensorRT 5 来 运行 代码。

同上,如果显示Could not load dynamic library 'libcudart.so.10.0',你需要cuda 10.0中的库来运行代码。

因此更新您的 tensorrt/Cuda/Cudnn 以匹配您的 tensorflow 版本会有所帮助。请注意,您的 tensorrt/cuda/cudnn 版本也应该相互匹配。

wget http://developer.download.nvidia.com/compute/machine-learning/repos/ubuntu1804/x86_64/nvidia-machine-learning-repo-ubuntu1804_1.0.0-1_amd64.deb

sudo apt install ./nvidia-machine-learning-repo-ubuntu1804_1.0.0-1_amd64.deb
sudo apt-get update

jakub 回答中的一些信息。如果您不安装 'machine-learning' 存储库,可能会发生这种情况。如果您已经成功安装 CUDA 但仍然出现错误,请尝试此操作。

然后安装TensorRT。需要上面安装libcudnn7。

sudo apt-get install -y --no-install-recommends libnvinfer6=6.0.1-1+cuda10.1 \
    libnvinfer-dev=6.0.1-1+cuda10.1 \
    libnvinfer-plugin6=6.0.1-1+cuda10.1