K8S 自动伸缩触发 Cloud Function

K8S Autoscaling trigger Cloud Function

当我的节点池在高性能条件下自动缩放时,是否可以触发 GCloud 中的 Pub/Sub 事件或 Google Cloud Function?

或者是否有任何其他分析事件可用于触发 Cloud Function?

当通过设置 sink on Stackdriver logs 以 Pub/Sub 主题作为目标扩展节点池时,您会收到通知(在 Pub/Sub 中)。

您必须收听与节点池扩展对应的特定日志。您可以为水槽使用 2 个过滤器。与这些过滤器之一对应的任何消息都将发送到 Pub/Sub 主题,这意味着您可以在该主题中发布消息时触发 Cloud Functions。

过滤实例组

您可以在实例组上使用此过滤器(GKE 节点池实际上是计算 VM 的托管实例组):

resource.type="gce_instance_group_manager" AND
resource.labels.instance_group_manager_name:"gke-<cluster_name>-default-pool" AND
protoPayload.methodName="v1.compute.instanceGroupManagers.resize" AND
operation.last="true"

(请将 <cluster_name> 替换为您的集群名称,并将 <node_pool_name> 替换为节点池名称,例如 default-pool)。

过滤集群自动缩放器日志

您也可以使用这个过滤器:

resource.type="k8s_cluster" AND
logName="projects/<project_id>/logs/container.googleapis.com%2Fcluster-autoscaler-visibility" AND
jsonPayload.decision.scaleUp.increasedMigs.mig.nodepool="<node_pool_name>"

(请将<project_id>替换为您的项目ID,将<node_pool_name>替换为节点池名称,如default-pool)。

这个过滤器的有趣之处在于,您可以通过查看 jsonPayload :

了解哪个 pod 导致了扩展,以及添加了多少节点
jsonPayload: {
    decision: {
        eventId: "41ddc559-c616-4068-8ba2-2f26eadcc7bd"
        decideTime: "1620897027"
        scaleUp: {
            increasedMigs: [
                0: {
                    mig: {
                        name: "gke-<cluster_name>-<node_pool_name>-xxxxxxxx-grp"
                        nodepool: "<node_pool_name>"
                        zone: "<zone>"
                    }
                    requestedNodes: 1
                }
            ]
            triggeringPods: [
                0: {
                    name: "<pod_name_causing_the_scale_up>"
                    namespace: "<pod_namespace>"
                }
            ]
            triggeringPodsTotalCount: 1
        }
    }
}