MySQL 的 Debezium 连接器。缺少数据库历史主题

Debezium connector for MySQL. The db history topic is missing

我正在使用 Debezium 连接器版本 0.8 从 MySQL 数据库捕获更改并将其移动到 Kafka。我正在使用 Docker 和一个用于 MySQL 的容器,另一个用于连接器,另一个用于 Kafka。

当我停止 Docker (docker-compose down) 并再次启动 Docker 时,通常会出现以下错误:

org.apache.kafka.connect.errors.ConnectException: The db history topic is missing. You may attempt to recover it by reconfiguring the connector to SCHEMA_ONLY_RECOVERY

我已经在官方页面上阅读了此问题的解决方案:

https://debezium.io/blog/2018/03/16/note-on-database-history-topic-configuration/

但我按照这些步骤操作,我认为我的配置没问题:

log.retention.bytes = -1
log.retention.hours = 168       
log.retention.minutes = null
log.retention.ms = -1

请注意,如果我将 log.retention.ms 设置为 -1 那么 log.retention.minuteslog.retention.hours 将不会像官方文档解释的那样使用,然后我解决了保留大小和保留时间问题。

那么,有人知道我为什么会收到此错误吗?

这是大学作业的一部分。我认为在我的大学发布之前我无法共享完整的 docker-compose 文件,但我可以向您展示与此问题相关的重要信息。我不认为这是一个配置问题,因为我的 docker-compose.

没有什么特别的
mysql:
    image: mysql/5.7:configured (Little changes like enabling queries...)
environment:
     - MYSQL_ROOT_PASSWORD=debezium
     - MYSQL_USER=mysqluser
     - MYSQL_PASSWORD=mysqlpw
    volumes:
     - "sql_Data:/var/lib/mysql"
     - "sql_LogError:/var/log/mysql"

kafka:
    image: debezium/kafka:0.8
    depends_on:
     - zookeeper
    environment:
     - HOST_NAME=xxxx
     - ADVERTISED_HOST_NAME=xxxx
     - ZOOKEEPER_CONNECT=zookeeper:2181
     - KAFKA_CREATE_TOPICS="events:1:1"
     - KAFKA_LOG_RETENTION_MS=-1
    volumes:
          - "kafka_Data:/kafka/data" 
          - "kafka_Log:/kafka/logs"
          - "kafka_Conf:/kafka/config"

connect:
    image: debezium/connect:0.8
    depends_on:
     - zookeeper
     - kafka
     - mysql
    environment:
     - HOST_NAME=xxxx
     - ADVERTISED_HOST_NAME=xxxx
     - BOOTSTRAP_SERVERS=xxxx:9092
     - GROUP_ID=1
     - CONFIG_STORAGE_TOPIC=my_connect_configs
     - OFFSET_STORAGE_TOPIC=my_connect_offsets
     - STATUS_STORAGE_TOPIC=my_connect_statuses
volumes: 
  sql_Data:
  sql_LogError:
  kafka_Data:
  kafka_Log:
  kafka_Conf:

而其他部分只是网络或无关的东西。

终于在和这个问题纠缠了很多天后找到了问题的原因和解决方法。

debezium/zookeeper 图像的文档中存在勘误表。正如您在 link:

中看到的

link to debezium/zookeeper image in dockerHub

文档建立3个卷来保存zookeeper需要的所有数据。这些卷的路径是:

  1. /zookeeper/data
  2. /zookeeper/logs
  3. /zookeeper/conf

这里的问题是第二个错了。根据其Dockerfile,第二个用于保存事务日志的路径必须是:

/zookeeper/txns

这是其 Dockerfile 的片段。

# Expose the ports and set up volumes for the data, transaction log, and configuration
EXPOSE 2181 2888 3888
VOLUME ["/zookeeper/data","/zookeeper/txns","/zookeeper/conf"]

我遇到了类似的问题。 mysql.properties 配置文件中的 database.server.iddatabase.server.name 必须是唯一的。

切勿让历史主题过期或删除历史主题。这就是导致问题的原因。

为避免主题过期,运行 根据此处的 Kafka 文档,以下内容:https://debezium.io/blog/2018/03/16/note-on-database-history-topic-configuration/

<KAFKA_DIR>/bin/kafka-configs.sh --zookeeper zookeeper:2181 --entity-type topics --entity-name <DB_HISTORY_TOPIC> --alter --add-config retention.bytes=-1

要在开发环境中解决此问题,只需删除您的原始连接器并重新创建一个具有不同名称的新连接器。

通过更改我正在传递的连接器属性文件中的名称,为我修复了错误。显然,尽管如此,我们删除了主题,并且无论何时您重新启动连接,所有名称都必须是唯一的。