Spark 广播到所有键 - updateStateByKey

Spark broadcast to all keys - updateStateByKey

UpdateStateByKey 很有用,但如果我想对所有现有键(不仅是此 RDD 中的键)执行操作怎么办?

例如字数 - 有没有办法将目前看到的 所有 个字数减少 1?

我正在考虑为每个节点保留静态 class 计数信息并发出广播命令以采取特定操作,但找不到广播到所有节点的功能。

Spark 无论如何都会对所有现有键执行 updateStateByKey。

还要注意,如果 updateStateByKey 函数 returns None(在 Scala 中),则键值对将被消除。