分布式 TensorFlow 是否支持 InfiniBand 互连 "out of the box"

Does Distributed TensorFlow support InfiniBand interconnections "out of the box"

我们有一个带有 InfiniBand 互连的集群。我知道 Distributed TF 使用 gRPC 来处理网络调用,但我想知道在使用 gRPC 时是否有任何特殊要求来获得 InfiniBand 连接的速度。

我认为答案是否定的。 从技术上讲,需要无限带宽支持的不是 Tensorflow,而是更多的 gRPC 层。

在 github gRPC 存储库中快速查询 infiniband 并收到零结果加强了我的假设:https://github.com/grpc?query=infiniband