有没有办法直接将 Amazon MSK Topic 转储到 S3?

Is there a way to dump Amazon MSK Topic to S3 directly?

我计划使用 Amazon MSK,我想将消费者日志转储到 S3。但我看不到任何选择。我需要编写自己的消费者还是有办法直接将 Amazon MSK 消费者输出消费到 s3?

MSK 没有直接的方法。您可以使用外部消费者来执行此操作,或者最好在与 MSK 相同的 VPC 内的 EC2 中使用 KafkaConnect

无论哪种方式,您都需要考虑高可用性和数据传输成本。对于HA,使用不同可用区的消费者。对于成本,使用允许消费者从最近的副本获取数据的MSK 2.4.1

Kafka Connect 通常是在 Kafka 和系统向下(和向上)流(例如 S3)之间获取数据的最佳 (easiest/scalable/portable/resilient) 方式。详细了解 Kafka Connect here and in this talk here

MSK Connect 可以 运行 Kafka Connect 工作负载用于 AWS 上的 MSK。

您的另一个选择是 运行 您自己的 Kafka Connect worker(连接到 MSK)并使用 S3 sink connector (tutorial).