apache storm 是否允许处理存储在 HDFS 上的大量文件?

Does apache storm allow the processing of volumunous files stored on HDFS?

apache storm 是否允许处理存储在 HDFS 上的大量文件?

知道我的目标是获得实时响应(秒或毫秒),

或者 apache storm 只专用于流处理!!

谢谢

Storm 仅用于流式处理(与批处理相反),但如果我对您的理解正确,您想从 HDFS 读取文件并进行处理吗?

storm-hdfs 模块有一个 spout(拓扑数据源)。它可能会做你想要的。

https://github.com/apache/storm/tree/master/external/storm-hdfs#hdfs-spout