使用 HAProxy Ingress Controller 时 TLS 握手间歇性失败

TLS handshake fails intermittently when using HAProxy Ingress Controller

我正在使用 HAProxy Ingress Controller (https://github.com/helm/charts/tree/master/incubator/haproxy-ingress) 为我的应用程序终止 TLS。 我有一个简单的 Node.JS 服务器监听 8080 的 HTTP,1935 作为一个简单的回显服务器(不是 HTTP)。
我使用 HAProxy Ingress 控制器将端口包装在 TLS 中。 (8080 -> 443 (HTTPS), 1935 -> 1936 (TCP + TLS))
我用

安装了 HAProxy Ingress Controller
helm upgrade --install haproxy-ingress incubator/haproxy-ingress \
   --namespace test \
  -f ./haproxy-ingress-values.yaml \
  --version v0.0.27

,其中haproxy-ingress-values.yaml的内容为


controller:
  ingressClass: haproxy
  replicaCount: 1
  service:
    type: LoadBalancer
  tcp:
    1936: "test/simple-server:1935:::test/ingress-cert"
  nodeSelector:
    "kubernetes.io/os": linux
defaultBackend:
  nodeSelector:
    "kubernetes.io/os": linux

这是我的入口:


apiVersion: networking.k8s.io/v1beta1
kind: Ingress
metadata:
  name: ingress
  annotations:
    kubernetes.io/ingress.class: "haproxy"
spec:
  tls:
  - hosts:
    secretName: ingress-cert
  rules:
    - http:
        paths:
        - path: /
          backend:
            serviceName: "simple-server"
            servicePort: 8080

证书是自签名的。 如果我用

测试 TLS 握手
echo | openssl s_client -connect "<IP>":1936

有时(大约 1/3 的次数)它会失败

CONNECTED(00000005)
139828847829440:error:1408F10B:SSL routines:ssl3_get_record:wrong version number:../ssl/record/ssl3_record.c:332:
---
no peer certificate available
---
No client certificate CA names sent
---
SSL handshake has read 5 bytes and written 316 bytes
Verification: OK
---
New, (NONE), Cipher is (NONE)
Secure Renegotiation IS NOT supported
Compression: NONE
Expansion: NONE
No ALPN negotiated
Early data was not sent
Verify return code: 0 (ok)
---

443端口不会出现同样的问题
有关重现问题的设置的详细信息,请参阅 here

[编辑]
正如@JoaoMorais 所指出的,这是因为默认的统计端口是 1936。 虽然我没有开启统计,但好像还是会干扰行为。
有两种解决方案适合我。

controller:
  stats:
    port: 5000

HAProxy 默认允许在相同或其他 frontend/listen 部分以及其他 haproxy 进程中重复使用相同的端口号。这可以通过在 global 部分添加 noreuseport 来更改。

默认的 HAProxy Ingress 配置使用端口号 1936 来公开统计信息。如果这样的端口号被例如 tcp 代理重用,传入的请求将在两个前端之间分配 - 有时会调用您的服务,有时会调用统计页面。将 tcp 代理或统计页面 (doc here) 更改为另一个端口应该可以解决问题。