为什么在创建图像时 docker 找不到 TensorFlow CPU 2.7.0?

Why TensorFlow CPU 2.7.0 is not found by docker while creating an image?

我正在构建一个 docker 图像,使用这个 Dockerfile:

FROM python:3.8-alpine
EXPOSE 5000/tcp
WORKDIR /app
COPY . /app
RUN pip install -r requirements.txt
CMD [ "python", "./app.py" ]

这是我使用的命令:

docker build -t my-language-app:1.0 .

它给出了这个错误:

[+] Building 91.5s (9/9) FINISHED
 => [internal] load build definition from Dockerfile                                                               0.0s
 => => transferring dockerfile: 32B                                                                                0.0s
 => [internal] load .dockerignore                                                                                  0.0s
 => => transferring context: 2B                                                                                    0.0s
 => [internal] load metadata for docker.io/library/python:3.8-alpine                                               3.3s
 => [auth] library/python:pull token for registry-1.docker.io                                                      0.0s
 => [internal] load build context                                                                                  0.0s
 => => transferring context: 3.71kB                                                                                0.0s
 => [1/4] FROM docker.io/library/python:3.8-alpine@sha256:ae21a996ebe902ddc73cff020202d94cb539c8c4426f67636374b32  0.0s
 => CACHED [2/4] WORKDIR /app                                                                                      0.0s
 => [3/4] COPY . /app                                                                                              2.0s
 => ERROR [4/4] RUN pip install -r requirements.txt                                                               86.1s
------
 > [4/4] RUN pip install -r requirements.txt:
#9 5.199 Collecting Flask==1.1.2
#9 5.529   Downloading Flask-1.1.2-py2.py3-none-any.whl (94 kB)
#9 8.898 Collecting numpy
#9 8.978   Downloading numpy-1.21.4.zip (10.6 MB)
#9 64.97   Installing build dependencies: started
#9 84.51   Installing build dependencies: finished with status 'done'
#9 84.51   Getting requirements to build wheel: started
#9 85.15   Getting requirements to build wheel: finished with status 'done'
#9 85.15     Preparing wheel metadata: started
#9 85.64     Preparing wheel metadata: finished with status 'done'
#9 85.88 ERROR: Could not find a version that satisfies the requirement tensorflow-cpu==2.7.0 (from versions: none)
#9 85.88 ERROR: No matching distribution found for tensorflow-cpu==2.7.0
#9 85.89 WARNING: You are using pip version 21.2.4; however, version 21.3.1 is available.
#9 85.89 You should consider upgrading via the '/usr/local/bin/python -m pip install --upgrade pip' command.
------
executor failed running [/bin/sh -c pip install -r requirements.txt]: exit code: 1

当此 TensorFlow 版本为 available 时,为什么找不到 tensorflow-cpu==2.7.0。怎么了?

这是我的 requirements.txt:

Flask==1.1.2
numpy
tensorflow-cpu==2.7.0

什么是工作:

  1. 只在 requirements.txt 中写入 tensorflow 也是行不通的。
  2. requirements.txt 中删除 tensorflow 并在 Dockerfile 上添加此 RUN python3.8 -m pip install tensorflow 命令,同样无效。
  3. 运行 Dockerfile 中的这个命令 pip3 install --upgrade https://storage.googleapis.com/tensorflow/windows/cpu/tensorflow_cpu-2.7.0-cp39-cp39-win_amd64.whl 也不起作用。
  4. 将 Dockerfile FROM python:3.8-alpine 中的 Python 版本更改为 3.93.73.6 无效。

使用 python:3.7.3-stretch 而不是 python:3.8-alpine 对我有用

FROM python:3.7.3-stretch
RUN mkdir /app
WORKDIR /app
COPY . .
RUN python -m pip install --upgrade pip
RUN pip install -r requirements.txt
CMD [ "python", "./app.py" ]

PS. 这是一个可行的答案,但我仍然想知道为什么 Alpine 还没有找到 TensorFlow。

通过互联网进行挖掘和搜索后,这里与我的类似的主要问题是 TensorFlow 没有对 linux/arm64 体系结构的原生支持,直到现在 22-01-2022。

错误是因为没有找到 linux/arm64 图像的包,所以为了解决这个问题,我们可以强制平台为 x86-64 架构和 运行 通过仿真容器以下步骤:

  1. 将此 FROM --platform=linux/amd64 python:3.8-alpine 而不是 FROM python:3.8-alpine 添加到您的 Docker 文件或使用您想要的任何容器。但是在添加 --platform 参数之前,请确保容器镜像支持你的 OS 和体系结构。不加这个参数 Docker 选择 linux/arm64 因为它与 arm64 主机有更好的兼容性。

  2. (对于 Mac OS Montrey 和任何使用端口 5000 的框架,如 Python Flask only)然后,你会发现使用了端口 5000。这是由于 airplay 侦听此端口,您可以通过转到 'System Preferences -> Sharing' 并取消选中 AirPlay Receiver 来禁用它。您可以稍后在完成开发后启用它或更改您的应用程序使用的端口。

  3. 然后您会发现 'qemu' 的进一步并发症,docker 的虚拟机管理程序在 arm64 上模拟 x86-64 给您以下错误 qemu: uncaught target signal 6 (Aborted) - core dumped,发生这种情况是因为 TensorFlow 使用 qemu 不支持的 AVX 指令https://gitlab.com/qemu-project/qemu/-/issues/164. You can use a community package that's built with No AVX from here https://github.com/yaroslavvb/tensorflow-community-wheels/issues 并强制重新安装以保持您的需求文件完好无损 RUN python -m pip install --force-reinstall https://tf.novaal.de/barcelona/tensorflow-2.7.0-cp38-cp38-linux_x86_64.whl

最后,构建并 运行 你的容器和一切都应该正常工作。


我尚未测试的替代解决方案,即为 linux/arm64 构建客户 TensorFlow 包。您可以在此处找到一个 GitHub 存储库,并从中构建一个 docker 容器 https://github.com/ARM-software/Tool-Solutions/tree/master/docker/tensorflow-aarch64

或者,您可以直接从 DockerHub 下载容器 link https://hub.docker.com/r/armswdev/tensorflow-arm-neoverse/ ,然后您可以在该镜像之上构建任何您想要的工具或使用它进行开发.

免责声明:我不是上述任何回购协议的所有者,您应该自行决定使用它。