Kafka:Docker 中的应用程序 运行 不使用主机发布的事件
Kafka: events published from the host machine are not consumed by the application running in Docker
我正在为应用程序编写端到端测试。我启动了一个应用程序实例、一个 Kafka 实例和一个 Zookeeper(全部 Docker 化),然后我与应用程序 API 交互以测试其功能。我需要在此应用程序中测试事件使用者的功能。我从我的测试中发布事件,应用程序应该处理它们。
问题: 如果我在本地 运行 应用程序(不在 Docker 中)并且 运行 测试会产生事件,消费者在应用程序代码中正确处理事件。在这种情况下,消费者和测试将 bootstrapServers
设置为 localhost:9092
。但是,如果应用程序 运行 作为 Docker 化实例,则它看不到事件。在这种情况下,bootstrapServers
在应用程序中设置为 kafka:9092
,在测试中设置为 localhost:9092
,其中 kafka
是一个 Docker 容器名称。 kafka
容器将其 9092
端口暴露给主机,以便可以从 Docker 容器内部和主机访问相同的 Kafka 实例(运行ning 我的测试).
代码中的唯一区别是 localhost
与 kafka
设置为 bootstrap 服务器。在这两种情况下,消费者和生产者都成功启动;事件发布没有错误。只是在一种情况下,消费者没有收到事件。
问题:如何让Docker化的消费者看到从主机发布的事件?
注意:我有一个正确配置的 Docker 网络,其中包括应用程序实例、Zookeeper 和 Kafka。他们都“看到”对方。 kafka
和zookeeper
对应的端口暴露给主机。
Kafka 端口:0.0.0.0:9092->9092/tcp
。动物园管理员端口:22/tcp, 2888/tcp, 3888/tcp, 0.0.0.0:2181->2181/tcp
.
我正在使用 wurstmeister/kafka and wurstmeister/zookeeper Docker 图片(我无法替换它们)。
任何 ideas/thoughts 不胜感激。你会如何调试它?
更新: 问题出在 KAFKA_ADVERTISED_LISTENERS
和 KAFKA_LISTENERS
env 变量上,它们被设置为用于内部和外部通信的不同端口。解决方案是在 Docker 容器内 运行 时在应用程序代码中使用正确的端口。
您一直在引用 8092
。那是故意的吗? Kafka 运行s 在 9092
。最简单的测试是下载相同版本的 Kafka 并手动 运行 其 kafka-console-consumer
和 kafka-console-producer
脚本以查看是否可以从主机 pub-sub
您是否在 dockerized 应用程序中尝试过“host.docker.internal”?
您可以为您的容器创建一个 docker network,然后容器将能够相互解析主机名并进行通信。
注意:这可用于 docker-compose 以及独立容器
此类问题通常与 Kafka 处理代理地址的方式有关。
当您启动 Kafka 代理时,它会将自己绑定到 0.0.0.0:9092
并使用地址 <hostname>:9092
在 Zookeeper 上注册自己。当您连接到客户端时,将联系 Zookeeper 以获取特定代理的地址。
这意味着当你启动一个Kafka容器时,你会遇到如下情况:
- 容器名称:kafka
- 网络名称:kafkanet
- 主机名:kafka
- 在动物园管理员上注册:kafka:9092
现在,如果您从 kafkanet 网络内的容器将客户端连接到您的 Kafka,您从 Zookeeper 返回的地址是 kafka:9092
,可通过 kafkanet
网络解析。
但是,如果您从 docker 外部连接到 Kafka(即使用 docker 映射的 localhost:9092
端点),您仍然会得到 kafka:9092
地址无法解决。
为了解决这个问题,您可以在代理配置中指定 advertised.host.name
和 advertised.port
,这样地址就可以被所有客户端解析 (see documentation) .
通常所做的是将 advertised.host.name
设置为 <container-name>.<network>
(在您的情况下类似于 kafka.kafkanet),以便连接到网络的任何容器都能够正确解析 IP卡夫卡经纪人。
然而,在您的情况下,您有一个混合网络配置,因为一些组件位于 docker 内部(因此能够解析 kafkanet 网络),而其他组件位于它外部。如果它是一个生产系统,我的建议是将 advertised.host.name
设置为主机的 DNS/IP 并始终依赖 docker 端口映射来到达 Kafka 代理。
然而,根据我的理解,您只需要此设置来测试,所以最简单的方法是“欺骗”生活在 docker 之外的系统。使用上面指定的命名,这意味着只需将行 127.0.0.1 kafka.kafkanet
.
添加到您的 /etc/hosts
(或 windows 等价物)
这样,当您住在 docker 外面的客户连接到 Kafka 时,应该会发生以下情况:
- 客户端 -> Kafka 通过 localhost:9092
- kafka 查询 Zookeeper 和 return 主机
kafka.kafkanet
- 客户端将
kafka.kafkanet
解析为 127.0.0.1
- 客户端 -> Kafka 通过 127.0.0.1:9092
编辑
正如评论中指出的那样,较新的 Kafka 版本现在使用 listeners
和 advertised.listeners
的概念来代替 host.name
和 advertised.host.name
(已弃用,仅在未指定上述内容的情况下使用)。然而,总体思路是相同的:
host.name
:指定 Kafka 代理应绑定到的主机(与 port
结合使用
listeners
:指定 Kafka 代理应绑定的所有端点(例如 PLAINTEXT://0.0.0.0:9092,SSL://0.0.0.0:9091
)
advertised.host.name
:指定代理如何向客户端公布(即客户端应使用哪个地址连接到它)
avertised.listeners
:指定所有通告的端点(例如PLAINTEXT://kafka.example.com:9092,SSL://kafka.example.com:9091
)
在这两种情况下,为了使客户端能够与 Kafka 成功通信,它们需要能够解析并连接到 advertised
主机名和端口。
在这两种情况下,如果未指定,它们都是由代理使用代理 运行 所在机器的主机名自动派生的。
我正在为应用程序编写端到端测试。我启动了一个应用程序实例、一个 Kafka 实例和一个 Zookeeper(全部 Docker 化),然后我与应用程序 API 交互以测试其功能。我需要在此应用程序中测试事件使用者的功能。我从我的测试中发布事件,应用程序应该处理它们。
问题: 如果我在本地 运行 应用程序(不在 Docker 中)并且 运行 测试会产生事件,消费者在应用程序代码中正确处理事件。在这种情况下,消费者和测试将 bootstrapServers
设置为 localhost:9092
。但是,如果应用程序 运行 作为 Docker 化实例,则它看不到事件。在这种情况下,bootstrapServers
在应用程序中设置为 kafka:9092
,在测试中设置为 localhost:9092
,其中 kafka
是一个 Docker 容器名称。 kafka
容器将其 9092
端口暴露给主机,以便可以从 Docker 容器内部和主机访问相同的 Kafka 实例(运行ning 我的测试).
代码中的唯一区别是 localhost
与 kafka
设置为 bootstrap 服务器。在这两种情况下,消费者和生产者都成功启动;事件发布没有错误。只是在一种情况下,消费者没有收到事件。
问题:如何让Docker化的消费者看到从主机发布的事件?
注意:我有一个正确配置的 Docker 网络,其中包括应用程序实例、Zookeeper 和 Kafka。他们都“看到”对方。 kafka
和zookeeper
对应的端口暴露给主机。
Kafka 端口:0.0.0.0:9092->9092/tcp
。动物园管理员端口:22/tcp, 2888/tcp, 3888/tcp, 0.0.0.0:2181->2181/tcp
.
我正在使用 wurstmeister/kafka and wurstmeister/zookeeper Docker 图片(我无法替换它们)。
任何 ideas/thoughts 不胜感激。你会如何调试它?
更新: 问题出在 KAFKA_ADVERTISED_LISTENERS
和 KAFKA_LISTENERS
env 变量上,它们被设置为用于内部和外部通信的不同端口。解决方案是在 Docker 容器内 运行 时在应用程序代码中使用正确的端口。
您一直在引用 8092
。那是故意的吗? Kafka 运行s 在 9092
。最简单的测试是下载相同版本的 Kafka 并手动 运行 其 kafka-console-consumer
和 kafka-console-producer
脚本以查看是否可以从主机 pub-sub
您是否在 dockerized 应用程序中尝试过“host.docker.internal”?
您可以为您的容器创建一个 docker network,然后容器将能够相互解析主机名并进行通信。
注意:这可用于 docker-compose 以及独立容器
此类问题通常与 Kafka 处理代理地址的方式有关。
当您启动 Kafka 代理时,它会将自己绑定到 0.0.0.0:9092
并使用地址 <hostname>:9092
在 Zookeeper 上注册自己。当您连接到客户端时,将联系 Zookeeper 以获取特定代理的地址。
这意味着当你启动一个Kafka容器时,你会遇到如下情况:
- 容器名称:kafka
- 网络名称:kafkanet
- 主机名:kafka
- 在动物园管理员上注册:kafka:9092
现在,如果您从 kafkanet 网络内的容器将客户端连接到您的 Kafka,您从 Zookeeper 返回的地址是 kafka:9092
,可通过 kafkanet
网络解析。
但是,如果您从 docker 外部连接到 Kafka(即使用 docker 映射的 localhost:9092
端点),您仍然会得到 kafka:9092
地址无法解决。
为了解决这个问题,您可以在代理配置中指定 advertised.host.name
和 advertised.port
,这样地址就可以被所有客户端解析 (see documentation) .
通常所做的是将 advertised.host.name
设置为 <container-name>.<network>
(在您的情况下类似于 kafka.kafkanet),以便连接到网络的任何容器都能够正确解析 IP卡夫卡经纪人。
然而,在您的情况下,您有一个混合网络配置,因为一些组件位于 docker 内部(因此能够解析 kafkanet 网络),而其他组件位于它外部。如果它是一个生产系统,我的建议是将 advertised.host.name
设置为主机的 DNS/IP 并始终依赖 docker 端口映射来到达 Kafka 代理。
然而,根据我的理解,您只需要此设置来测试,所以最简单的方法是“欺骗”生活在 docker 之外的系统。使用上面指定的命名,这意味着只需将行 127.0.0.1 kafka.kafkanet
.
/etc/hosts
(或 windows 等价物)
这样,当您住在 docker 外面的客户连接到 Kafka 时,应该会发生以下情况:
- 客户端 -> Kafka 通过 localhost:9092
- kafka 查询 Zookeeper 和 return 主机
kafka.kafkanet
- 客户端将
kafka.kafkanet
解析为 127.0.0.1 - 客户端 -> Kafka 通过 127.0.0.1:9092
编辑
正如评论中指出的那样,较新的 Kafka 版本现在使用 listeners
和 advertised.listeners
的概念来代替 host.name
和 advertised.host.name
(已弃用,仅在未指定上述内容的情况下使用)。然而,总体思路是相同的:
host.name
:指定 Kafka 代理应绑定到的主机(与port
结合使用
listeners
:指定 Kafka 代理应绑定的所有端点(例如PLAINTEXT://0.0.0.0:9092,SSL://0.0.0.0:9091
)advertised.host.name
:指定代理如何向客户端公布(即客户端应使用哪个地址连接到它)avertised.listeners
:指定所有通告的端点(例如PLAINTEXT://kafka.example.com:9092,SSL://kafka.example.com:9091
)
在这两种情况下,为了使客户端能够与 Kafka 成功通信,它们需要能够解析并连接到 advertised
主机名和端口。
在这两种情况下,如果未指定,它们都是由代理使用代理 运行 所在机器的主机名自动派生的。