是否可以 运行 tf transform on spark?
Is it possible to run tf transform on spark?
tf transform 对特征处理很方便,但在没有分布式计算的大数据集上 运行 效率不高。 tf transform 运行s on beam,据我所知,它可以使用多个 运行ners,如数据流、spark 运行ners 等,但我找不到任何关于 运行 的例子] 在 spark 上进行 tf 转换。不知道现在支持不支持
我认为您现在还不能 运行 tf.transform 在 Spark 上。
tf.transform 在 Python 和 Beam's Spark runner only supports Java. AFAIK only the Google's Cloud Dataflow runner works with Python and tf.transform. There is one article mentioned PySpark 中,但不确定如何放入。
Beam 正在进行 运行 更进一步的开发,最进一步的可能是 Flink Runner which has Python SDK, but it is still under development, and support and examples are very sparse. 。
tf transform 对特征处理很方便,但在没有分布式计算的大数据集上 运行 效率不高。 tf transform 运行s on beam,据我所知,它可以使用多个 运行ners,如数据流、spark 运行ners 等,但我找不到任何关于 运行 的例子] 在 spark 上进行 tf 转换。不知道现在支持不支持
我认为您现在还不能 运行 tf.transform 在 Spark 上。
tf.transform 在 Python 和 Beam's Spark runner only supports Java. AFAIK only the Google's Cloud Dataflow runner works with Python and tf.transform. There is one article mentioned PySpark 中,但不确定如何放入。
Beam 正在进行 运行 更进一步的开发,最进一步的可能是 Flink Runner which has Python SDK, but it is still under development, and support and examples are very sparse.