如何评估我的 TensorFlow 模型在大型数据集的特定切片上的性能?

How can I evaluate the performance of my TensorFlow model on specific slices of a large dataset?

如何评估我的 TensorFlow 模型在大型评估数据集的特定切片(片段)上的性能?

使用 TensorFlow 模型分析 (TFMA),这是一个 open-source 库,结合了 TensorFlow 和 Apache Beam 来计算和可视化评估指标。它专为这种用例而设计,允许您使用 TensorFlow 训练器中定义的相同指标,以分布式方式评估基于大量数据的模型。这些指标也可以在不同的数据切片上计算,结果可以在 Jupyter Notebooks 中可视化。 TFMA 使用 Apache Beam 对您指定的评估数据集进行完整传递。这不仅可以更准确地计算指标,还可以扩展到大量评估数据集,因为 Beam 管道可以 运行 使用分布式处理 back-ends。

有关详细信息,请参阅 https://github.com/tensorflow/model-analysis