使用 "unable to find container named fluentd-gcp" 记录垃圾邮件

Log spam with "unable to find container named fluentd-gcp"

昨晚我在 GKE 上的 Kubernetes 集群升级到 1.16.8-gke.9。从那时起,日志每分钟显示 error: unable to find container named fluentd-gcp。从我的应用程序登录仍然有效,但我想知道导致此错误的原因以及如何消除此错误。

扩大错误会产生更多细节:

{
  "textPayload": "error: unable to find container named fluentd-gcp\n",
  "insertId": "v1b2u2ldrnswujhz2",
  "resource": {
    "type": "k8s_container",
    "labels": {
      "project_id": "foo",
      "pod_name": "fluentd-gke-scaler-cd4d654d7-tgg27",
      "cluster_name": "foo-cluster",
      "container_name": "fluentd-gke-scaler",
      "namespace_name": "kube-system",
      "location": "us-east1-d"
    }
  },
  "timestamp": "2020-04-24T16:15:40.224944500Z",
  "severity": "ERROR",
  "labels": {
    "gke.googleapis.com/log_type": "system",
    "k8s-pod/k8s-app": "fluentd-gke-scaler",
    "k8s-pod/pod-template-hash": "cd4d654d7"
  },
  "logName": "projects/foo/logs/stderr",
  "receiveTimestamp": "2020-04-24T16:15:45.923960735Z"
}

kubectl get all --all-namespaces 显示带有 fluentd-gke 容器的 fluentd-gke pods,而不是 fluentd-gcp.

如有任何建议,我将不胜感激,如果您告诉我在哪里可以找到它们,我很乐意 post 更多详细信息。

编辑:有关 GKE 问题跟踪器的更多详细信息和相关问题:https://issuetracker.google.com/issues/156965162

1.16.8-gke.9 目前正在通过快速通道提供。请记住,此类渠道是在早期访问的基础上提供的,供人们测试新版本,因此所提供的版本可能会遇到未解决的问题,并且没有已知的解决方法。那就是说可能的解决方法是耗尽和 migrate your workloads to another node. If issue persists, then create an issue here.

根据问题跟踪器,这将在 GKE 1.16.9-gke.6 中得到修复:https://issuetracker.google.com/issues/156965162