CloudWatch 监控和通知

CloudWatch Monitoring and Notifications

我正在使用各种 AWS 服务(Lambda、Glue、S3、Redshift、EC2)进行 ETL 处理。我正在尝试创建一个 'log ETL flow' 以在流程中的某个步骤失败时发送监控和通知(电子邮件或其他方式)。

我已经检查过我使用的每项服务都有指标记录在 CloudWatch 中。我现在正试图找出一种处理这些数据的聪明方法,以便在步骤失败时发送通知 and/or 对整个流程进行中央监控。

是否有此设置的最佳实践或示例?

这似乎是 CloudWatch Alarms 的完美案例。

You can create a CloudWatch alarm that watches a single CloudWatch metric or the result of a math expression based on CloudWatch metrics. The alarm performs one or more actions based on the value of the metric or expression relative to a threshold over a number of time periods. The action can be an Amazon EC2 action, an Amazon EC2 Auto Scaling action, or a notification sent to an Amazon SNS topic.

您可以创建链式 CloudWatch 警报 -> SNS

您可以使用 SNS 通过 SMS or Push Notifications 通知用户。
或者您可以多做一步 SNS -> SES 来发送电子邮件。