docker 集群模式下的数据库迁移

Database migrations in docker swarm mode

我有一个由简单的 Node 应用程序和 Mongo 数据库组成的应用程序。我想知道,如何在 docker 群模式下 运行 数据库迁移?

没有群模式我运行通过首先停止旧版本的应用程序进行迁移,运行使用新版本的应用程序使用一次性迁移命令,然后最后启动新版本的应用程序:

# Setup is roughly the following
$ docker network create appnet
$ docker run -d --name db --net appnet db:1
$ docker run -d --name app --net appnet -p 80:80 app:1

# Update process
$ docker stop app && docker rm app
$ docker run --rm --net appnet app:2 npm run migrate
$ docker run -d --name app --net appnet -p 80:80 app:2

现在我正在 docker 集群模式下测试设置,以便我可以轻松扩展 app。问题是在 swarm 模式下,无法在 swarm 网络中启动容器,因此我无法访问数据库以进行 运行 迁移:

$ docker network ls
NETWORK ID          NAME                DRIVER              SCOPE
6jtmtihmrcjl        appnet              overlay             swarm

# Trying to replicate the manual migration process in swarm mode
$ docker service scale app=0
$ docker run --rm --net appnet app:2 npm run migrate
docker: Error response from daemon: swarm-scoped network (appnet) is not compatible with `docker create` or `docker run`. This network can only be used by a docker service.

我也不想 运行 在 app 启动期间执行迁移命令,因为可能会启动多个实例,这可能会破坏数据库。自动迁移很可怕,所以我想不惜一切代价避免它们。

你知道如何在 docker swarm 模式下实现手动迁移步骤吗?

编辑

我发现了一个 dirty hack 可以复制原始工作流程。想法是使用自定义命令创建一个新服务,并在其中一项任务完成后将其删除。这远非令人愉快的用法,我们非常欢迎更好的选择!

$ docker service scale app=0
$ docker service create --name app-migrator --network appnet app:2 npm run migrate

# Check when the first app-migrator task is finished and check its output
$ docker service ps app-migrator
$ docker logs <container id from app-migrator>
$ docker service rm app-migrator

# Ready to update the app
$ docker service update --image app:2 --replicas 2 app

这确实是一个棘手的情况,尽管我认为 运行在启动期间进行迁移可能是拼图的最后一块。

我现在使用的方法(虽然不是很优雅,但有效)是使用 message queue(我使用的是 redis),在应用程序启动时,它会发送一个消息给 queue,通知它 migration 任务需要 运行。在 queue 的另一端,我有一个 listener app 将处理 queue 和 运行 migration 任务。迁移任务只会 运行 一次,因为只有一个实例 listener 运行 按顺序执行它。所以基本上我只是使用 queuelistener app 来确保 migration 任务 运行 只执行一次。

我相信您可以通过使覆盖网络 appnet 可附加来解决此问题。这可以通过以下命令完成:

docker network create --driver overlay --attachable appnet

这应该可以修复 swarm-scoped 网络错误并允许您 运行 迁移