Streams 和 Firehose 的用例是什么？

What's the use cases of Streams and Firehose?

我正在开发一个可以读取和分析支付交易日志的应用程序。我知道我将根据我的要求使用 Kinesis Analytics，它从 Data Streams 和 Firehose 获取输入。但是我无法决定我的系统应该使用哪种输入法。 我的要求是：

哪种输入流适合我的用例？

Kinesis Stream (KS) 和 Firehose (FH) 之间存在一些关键区别：

从你写的来看，我认为应该首先考虑FH，因为你不关心non-real-time FH的性质，它更容易管理和设置，你可以specify S3 as a backup对于失败或所有消息：

Kinesis Data Firehose uses Amazon S3 to backup all or failed only data that it attempts to deliver to your chosen destination.

如果传送或 lambda 处理失败，S3 备份可确保您不会丢失记录。随后，在我看来，Firehose 很好地解决了您的两点问题。

数据流与 Firehose

Kinesis Data Streams 允许消费者READ 流数据。它为您提供了很多选择。它最适合需要自定义处理、选择流处理框架和 sub-second 处理延迟的用例。数据可靠地存储在流中长达 7 天，并分布在 3 个可用区中。

Kinesis Firehose 用于 LOAD 将数据流式传输到目标位置（S3、Elasticsearch、Splunk 等）。您还可以在将流式数据加载到目标之前对其进行转换（通过使用 Lambda）。失败尝试的数据将保存到 S3。

因此，如果您的目标是仅将数据加载到 Kinesis Data Analytics 服务中，并且首先尝试使用 Kinesis Firehose 时pre-processing。

请注意，在选择合适的服务时，您还需要考虑成本、开发工作、扩展选项、数据量等方面。

您可以使用 firehose 进行分析，但问题是 firehose 如何获取数据？您可以编写自己的代码来提供数据或使用运动数据流。 Firehose 主要是流数据的传输系统，可以写入各种目的地，如 S3、Redshift 或其他具有执行数据转换的可选功能的目的地。