Kafka Streams 中的数据记录到底是什么?

What exactly is data record in Kafka Streams?

所以我已经阅读了足够多的教程和官方文档,但是我在数据记录中发现的所有内容几乎都是从一个来源复制粘贴到另一个来源:

  1. A stream partition is an, ordered, replayable, and fault-tolerant sequence of immutable data records, where a data record is defined as a key-value pair.

  2. Each stream partition is a totally ordered sequence of data records and maps to a Kafka topic partition. A data record in the stream maps to a Kafka message from that topic.

那么数据记录到底是什么?因为它映射了 kafka 消息,所以可以肯定地说它几乎是同一件事,还是它是另一个对象,具有关于 kafka 消息的某种信息?

一条数据记录不过是一条消息,它是结构化的key-value对,如name=smithid=101.

Stream 是 high-level 在 Kafka-streams 上下文中使用的术语,Kafka 流是 high-level API 构建在核心 kafka-clients 之上API 提供一些额外的功能。

通常, 流是数据流,在这种情况下它是 collection 消息或 data-records。

因此,当您说数据记录时,它仅表示 Kafka 消息,而不是其他 object 具有 一些信息(或元数据) 关于 Kafka 消息。如果你想存储 一些其他信息称为元数据 ,它通常存储在 Kafka headers 中 message/data-record。