storm - 如何选择流分组

storm - how to choose a stream grouping

我正在使用 KafkaSpout 来读取/流式传输压缩 Byte[] 的消息。螺栓很简单:解压缩消息 -> 写入 Cassandra。我想知道要使用哪个 Stream Grouping

样本似乎主要使用Shuffle Grouping。在测试中,我一直在使用 All Grouping(假设我希望所有消息都通过一个螺栓),但我看到了关于 "Use this grouping with care" 的注释。

关于如何进行的建议?

Shuffle 分组足以满足您的用例,它可以在下游螺栓之间分配工作负载。

很少需要所有分组,并且会导致在所有下游螺栓中进行重复处理。

参考: https://storm.apache.org/documentation/Concepts.html#stream-groupings