MySQL 的 Debezium 连接器。缺少数据库历史主题
Debezium connector for MySQL. The db history topic is missing
我正在使用 Debezium 连接器版本 0.8 从 MySQL 数据库捕获更改并将其移动到 Kafka。我正在使用 Docker 和一个用于 MySQL 的容器,另一个用于连接器,另一个用于 Kafka。
当我停止 Docker (docker-compose down
) 并再次启动 Docker 时,通常会出现以下错误:
org.apache.kafka.connect.errors.ConnectException: The db history topic is missing. You may attempt to recover it by reconfiguring the connector to SCHEMA_ONLY_RECOVERY
我已经在官方页面上阅读了此问题的解决方案:
https://debezium.io/blog/2018/03/16/note-on-database-history-topic-configuration/
但我按照这些步骤操作,我认为我的配置没问题:
log.retention.bytes = -1
log.retention.hours = 168
log.retention.minutes = null
log.retention.ms = -1
请注意,如果我将 log.retention.ms
设置为 -1 那么 log.retention.minutes
和 log.retention.hours
将不会像官方文档解释的那样使用,然后我解决了保留大小和保留时间问题。
那么,有人知道我为什么会收到此错误吗?
这是大学作业的一部分。我认为在我的大学发布之前我无法共享完整的 docker-compose
文件,但我可以向您展示与此问题相关的重要信息。我不认为这是一个配置问题,因为我的 docker-compose
.
没有什么特别的
mysql:
image: mysql/5.7:configured (Little changes like enabling queries...)
environment:
- MYSQL_ROOT_PASSWORD=debezium
- MYSQL_USER=mysqluser
- MYSQL_PASSWORD=mysqlpw
volumes:
- "sql_Data:/var/lib/mysql"
- "sql_LogError:/var/log/mysql"
kafka:
image: debezium/kafka:0.8
depends_on:
- zookeeper
environment:
- HOST_NAME=xxxx
- ADVERTISED_HOST_NAME=xxxx
- ZOOKEEPER_CONNECT=zookeeper:2181
- KAFKA_CREATE_TOPICS="events:1:1"
- KAFKA_LOG_RETENTION_MS=-1
volumes:
- "kafka_Data:/kafka/data"
- "kafka_Log:/kafka/logs"
- "kafka_Conf:/kafka/config"
connect:
image: debezium/connect:0.8
depends_on:
- zookeeper
- kafka
- mysql
environment:
- HOST_NAME=xxxx
- ADVERTISED_HOST_NAME=xxxx
- BOOTSTRAP_SERVERS=xxxx:9092
- GROUP_ID=1
- CONFIG_STORAGE_TOPIC=my_connect_configs
- OFFSET_STORAGE_TOPIC=my_connect_offsets
- STATUS_STORAGE_TOPIC=my_connect_statuses
volumes:
sql_Data:
sql_LogError:
kafka_Data:
kafka_Log:
kafka_Conf:
而其他部分只是网络或无关的东西。
终于在和这个问题纠缠了很多天后找到了问题的原因和解决方法。
debezium/zookeeper
图像的文档中存在勘误表。正如您在 link:
中看到的
link to debezium/zookeeper image in dockerHub
文档建立3个卷来保存zookeeper需要的所有数据。这些卷的路径是:
/zookeeper/data
/zookeeper/logs
/zookeeper/conf
这里的问题是第二个错了。根据其Dockerfile
,第二个用于保存事务日志的路径必须是:
/zookeeper/txns
这是其 Dockerfile
的片段。
# Expose the ports and set up volumes for the data, transaction log, and configuration
EXPOSE 2181 2888 3888
VOLUME ["/zookeeper/data","/zookeeper/txns","/zookeeper/conf"]
我遇到了类似的问题。 mysql.properties
配置文件中的 database.server.id
和 database.server.name
必须是唯一的。
切勿让历史主题过期或删除历史主题。这就是导致问题的原因。
为避免主题过期,运行 根据此处的 Kafka 文档,以下内容:https://debezium.io/blog/2018/03/16/note-on-database-history-topic-configuration/
<KAFKA_DIR>/bin/kafka-configs.sh --zookeeper zookeeper:2181 --entity-type topics --entity-name <DB_HISTORY_TOPIC> --alter --add-config retention.bytes=-1
要在开发环境中解决此问题,只需删除您的原始连接器并重新创建一个具有不同名称的新连接器。
通过更改我正在传递的连接器属性文件中的名称,为我修复了错误。显然,尽管如此,我们删除了主题,并且无论何时您重新启动连接,所有名称都必须是唯一的。
我正在使用 Debezium 连接器版本 0.8 从 MySQL 数据库捕获更改并将其移动到 Kafka。我正在使用 Docker 和一个用于 MySQL 的容器,另一个用于连接器,另一个用于 Kafka。
当我停止 Docker (docker-compose down
) 并再次启动 Docker 时,通常会出现以下错误:
org.apache.kafka.connect.errors.ConnectException: The db history topic is missing. You may attempt to recover it by reconfiguring the connector to SCHEMA_ONLY_RECOVERY
我已经在官方页面上阅读了此问题的解决方案:
https://debezium.io/blog/2018/03/16/note-on-database-history-topic-configuration/
但我按照这些步骤操作,我认为我的配置没问题:
log.retention.bytes = -1
log.retention.hours = 168
log.retention.minutes = null
log.retention.ms = -1
请注意,如果我将 log.retention.ms
设置为 -1 那么 log.retention.minutes
和 log.retention.hours
将不会像官方文档解释的那样使用,然后我解决了保留大小和保留时间问题。
那么,有人知道我为什么会收到此错误吗?
这是大学作业的一部分。我认为在我的大学发布之前我无法共享完整的 docker-compose
文件,但我可以向您展示与此问题相关的重要信息。我不认为这是一个配置问题,因为我的 docker-compose
.
mysql:
image: mysql/5.7:configured (Little changes like enabling queries...)
environment:
- MYSQL_ROOT_PASSWORD=debezium
- MYSQL_USER=mysqluser
- MYSQL_PASSWORD=mysqlpw
volumes:
- "sql_Data:/var/lib/mysql"
- "sql_LogError:/var/log/mysql"
kafka:
image: debezium/kafka:0.8
depends_on:
- zookeeper
environment:
- HOST_NAME=xxxx
- ADVERTISED_HOST_NAME=xxxx
- ZOOKEEPER_CONNECT=zookeeper:2181
- KAFKA_CREATE_TOPICS="events:1:1"
- KAFKA_LOG_RETENTION_MS=-1
volumes:
- "kafka_Data:/kafka/data"
- "kafka_Log:/kafka/logs"
- "kafka_Conf:/kafka/config"
connect:
image: debezium/connect:0.8
depends_on:
- zookeeper
- kafka
- mysql
environment:
- HOST_NAME=xxxx
- ADVERTISED_HOST_NAME=xxxx
- BOOTSTRAP_SERVERS=xxxx:9092
- GROUP_ID=1
- CONFIG_STORAGE_TOPIC=my_connect_configs
- OFFSET_STORAGE_TOPIC=my_connect_offsets
- STATUS_STORAGE_TOPIC=my_connect_statuses
volumes:
sql_Data:
sql_LogError:
kafka_Data:
kafka_Log:
kafka_Conf:
而其他部分只是网络或无关的东西。
终于在和这个问题纠缠了很多天后找到了问题的原因和解决方法。
debezium/zookeeper
图像的文档中存在勘误表。正如您在 link:
link to debezium/zookeeper image in dockerHub
文档建立3个卷来保存zookeeper需要的所有数据。这些卷的路径是:
/zookeeper/data
/zookeeper/logs
/zookeeper/conf
这里的问题是第二个错了。根据其Dockerfile
,第二个用于保存事务日志的路径必须是:
/zookeeper/txns
这是其 Dockerfile
的片段。
# Expose the ports and set up volumes for the data, transaction log, and configuration
EXPOSE 2181 2888 3888
VOLUME ["/zookeeper/data","/zookeeper/txns","/zookeeper/conf"]
我遇到了类似的问题。 mysql.properties
配置文件中的 database.server.id
和 database.server.name
必须是唯一的。
切勿让历史主题过期或删除历史主题。这就是导致问题的原因。
为避免主题过期,运行 根据此处的 Kafka 文档,以下内容:https://debezium.io/blog/2018/03/16/note-on-database-history-topic-configuration/
<KAFKA_DIR>/bin/kafka-configs.sh --zookeeper zookeeper:2181 --entity-type topics --entity-name <DB_HISTORY_TOPIC> --alter --add-config retention.bytes=-1
要在开发环境中解决此问题,只需删除您的原始连接器并重新创建一个具有不同名称的新连接器。
通过更改我正在传递的连接器属性文件中的名称,为我修复了错误。显然,尽管如此,我们删除了主题,并且无论何时您重新启动连接,所有名称都必须是唯一的。