使用 Docker,触发 PANIC 的原因:无法找到有效的检查点记录

Using Docker, what triggered PANIC: could not locate a valid checkpoint record

我试图更好地理解 Docker,但在这样做的过程中,我似乎损坏了我的应用程序的 PostgreSQL 数据库。

我正在使用 Docker Swarm 启动我的应用程序,但我在 PostgreSQL 容器的循环中收到以下错误:

    2021-02-10 15:38:51.304 UTC 120 LOG:  database system was shut down at 2021-02-10 14:49:14 UTC
    2021-02-10 15:38:51.304 UTC 120 LOG:  invalid primary checkpoint record
    2021-02-10 15:38:51.304 UTC 120 LOG:  invalid secondary checkpoint record
    2021-02-10 15:38:51.304 UTC 120 PANIC:  could not locate a valid checkpoint record
    2021-02-10 15:38:51.447 UTC 1 LOG:  startup process (PID 120) was terminated by signal 6
    2021-02-10 15:38:51.447 UTC 1 LOG:  aborting startup due to startup process failure
    2021-02-10 15:38:51.455 UTC 1 LOG:  database system is shut down

最初,我试图通过转到FS中的挂载驱动器来修改容器中的pg_hba.conf文件,该驱动器位于

 /var/lib/docker/volumes/postgres96-data-volume/_data

但是,每次我重新启动容器时,我对 pg_hba.conf 的更改都会被还原。所以今天早上我在挂载文件夹中添加了一个名为 test 的虚拟文件并重新启动容器,希望该文件被删除以获得视觉验证,即重新启动容器会自动替换该挂载中的所有内容它是原始格式。再次重新启动后,我开始收到阻止我的应用程序启动的错误消息。

我删除了 test 文件并重新启动了容器,但错误消息仍然存在。

我阅读了很多关于如何修复它的解决方案,但我的问题更多是了解为什么添加文件会导致这种情况?我的卷是否仅仅因为我在其中添加了一个文件而损坏?

谢谢

此错误表示 Postgres 卷已损坏。当两个容器尝试同时连接到同一个卷时,就会发生这种情况。有关更多信息,请参阅 this answer。不确定修改文件如何损坏驱动器。不过,您需要删除并重新创建卷。为此,您可以:

$ docker stop <your_container_name> # stops a running container
$ docker image prune # removes all images that are not attached to a container
$ docker volume ls # list out active volumes
$ docker volume rm <volume_name> # Remove the volume that's corrupted

我不得不运行上面的代码来停止一个容器,清理不知何故没有附加到任何容器的图像,然后最终删除保存损坏数据的有问题的卷。