混合 TensorFlow 和 TensorFlow Federated 代码的推荐方法是什么?

What is the recommended way to mix TensorFlow and TensorFlow Federated code?

TensorFlow (TF) 和 TensorFlow Federated (TFF) 是不同的功能层,旨在很好地协同工作(顾名思义)。

不过,它们是不同的东西,旨在解决不同的问题。

我想知道以一种既可用于普通 TF 又可用于 TFF 工作负载的方式来描述计算的最佳方式是什么,以及人们可能希望避免的陷阱类型。

好问题。事实上,至少有 3 种方法来组合 TensorFlow 代码以与 TFF 一起使用,每种方法都有自己的优点。

  1. 使用 TensorFlow 的组合机制 (defuns) 是推荐的方式,假设它适用于您的特定情况。 TensorFlow 已经有了编写代码的机制,我们不想重新发明轮子。我们在 TFF (@tff.tf_computation) 中创建自己的组合机制的原因是为了处理特定的限制(例如在 TF 中缺乏对接口级别数据集的支持,以及需要 TF 组件来与 TFF 的其余部分互操作),我们最好将此机制的使用限制在真正需要它的情况下。

如果可能,使用@tf.function 装饰TensorFlow 组件,并仅在顶层将整个TensorFlow 块包装为@tff.tf_computation,然后再将其嵌入@tff.federated_computation .这样做的众多好处之一是它允许您使用标准 TensorFlow 工具在 TFF 之外测试组件。

因此,鼓励并首选以下内容:

# here using TensorFlow's compositional mechanism (defuns)
# rather than TFF's to decorate "foo"
@tf.function(...)
def foo(...):
  ...

@tff.tf_computation(...)
def bar(...):
  # here relying on TensorFlow to embed "foo" as a component of "bar"
  ...foo(...)...
  1. 使用 Python 的组合机制(简单的未修饰 Python 函数)也是一个不错的选择,尽管它不如 (1) 好,因为它只会导致一个代码体成为在定义时嵌入到另一个中,因为 TFF 跟踪所有 TFF 修饰的 Python 函数以构建要执行的计算的序列化表示,而不会为您提供隔离或任何其他特殊好处。

您可能仍然希望使用此模式来允许您的组件在 TFF 之外进行测试,或者在 (1) 或 (3) 都不起作用的情况下进行测试。

因此,如果 (1) 不起作用,以下是您应该首先考虑的替代方案:

# here composing things in Python, no special TF or TFF mechanism employed
def foo(...):
  # keep in mind that in this case, "foo" can access and tamper with
  # the internal state of "bar" - you get no isolation benefits
  ... 

@tff.tf_computation(...)
def bar(...):
  # here effectively just executing "foo" within "bar" at the
  # time "bar" is traced
  ...foo(...)...
  1. 不推荐使用 TFF 的组合机制 (@tff.tf_computation),除非 - 如上所述 - 在需要它的情况下,例如当 TensorFlow 组件需要接受数据集作为参数时,或者如果它将仅从 @tff.federated_computation 调用。请记住,TFF 对数据集作为参数的支持仍处于实验阶段,虽然在某些情况下它可能是唯一的解决方案,但您仍然可能 运行 遇到问题。您可以期待实现的发展。

不鼓励(尽管目前有时需要):

# here using TFF's compositional mechanism
@tff.tf_computation(...)
def foo(...):
  # here you do get isolation benefits - "foo" is traced and
  # serialized by TFF, but you can expect that e.g., some
  # tf.data.Dataset features won't work
  ...

@tff.tf_computation(...)
def bar(...):
  # here relying on TFF to embed "foo" within "bar"
  ...foo(...)...