无法在 Kubernetes 中连接 PostgreSQL

Failed to connect PostgreSQL in Kubernetes

我正在使用 Kubernetes。我有两个 pods.

在一个 pod 中,它是 运行 一台服务器。这是尝试在另一个 pod 中连接 PostgreSQL 服务的部分代码。

import (
    "context"
    "github.com/jackc/pgx/v4/pgxpool"
    "github.com/rs/zerolog/log"
)

databaseURL := "postgres://admin:passw0rd@my-database-service.hm:40072/my_db"
pg, err := pgxpool.Connect(context.Background(), databaseURL)
if err != nil {
    log.Error().Err(err).Msg("conn.Close")
    return nil
}

目前,以上代码报错

{"level":"error","error":"failed to connect to host=my-database-service.hm user=admin database=my_db: dial error (dial tcp 10.43.140.140:40072: connect: connection refused)","time":1627849943,"message":"conn.Close"}

然而,在我通过 ssh 进入服务器 pod 后,我可以通过 psql 成功连接到 PostgreSQL pod。

/usr/src/app # psql --host=my-database-service.hm --port=40072 --dbname=my_db --username=admin --password
Password: 
psql (13.3)
Type "help" for help.

my_db=# 

我尝试重新启动我的服务器 pod 以确保它在 PostgreSQL 数据库准备就绪后运行,但仍然出现同样的错误。

任何关于进一步调试的建议都会有所帮助。谢谢!


更新

我实际上在使用 Linkerd。可能与

有关

https://linkerd.io/2.10/features/protocol-detection/

我尝试将 PostgreSQL 更改为默认端口 5432,但仍然有问题。如果找到解决方案会更新。

经过一些实验,我可以确认我的问题与 Linkerd 无关。

我认为我的 PostgreSQL containerPort/targetPort 仍在使用默认的 5432。它通过端口 40072 由网络内部的 ClusterIP 公开,这就是为什么我不需要 mark the port as opaque 在 Linkerd 中。

原来加上os.Exit(1)后,

pg, err := pgxpool.Connect(context.Background(), databaseURL)
if err != nil {
    log.Error().Err(err).Msg("conn.Close")
    os.Exit(1) // <- this helps
}

my Kubernetes 将在最初等待 PostgreSQL 准备就绪失败时帮助重新启动服务器 pod。

重启几次后,server pod现在可以正常连接PostgreSQL了。

我想如果我早点手动重启更多次,可能也会有所帮助。但是像这样让Kubernetes帮忙重启肯定不靠谱