某公司在 AWS 平台大规模使用 Amazon EC2 实例来支撑各类业务应用。随着业务的发展和实例部署数量的增加,对 EC2 配额的有效监控变得至关重要。项目组需要实时了解 EC2 配额的使用情况,当配额接近上限时能够及时收到警报,以便提前采取措施,避免因配额不足导致新实例无法启动,进而影响业务的正常运行。
Amazon CloudWatch 能够收集和跟踪指标,收集监控数据并设置警报。 本方案利用 CloudWatch 对 EC2 的配额相关指标进行监控。通过 CloudWatch 监控 EC2 按需运行的特定实例类型配额,实例配额使用情况等指标(在 CloudWatch 中有对应表示配额使用比例等相关指标形式)。设置警报,当配额使用比例达到预设的阈值时,触发警报通知相关人员。
本次采用AWS Console界面完成作业。
注意:根据项目的具体情况,可以采用不同的实施方法。比如使用命令行(CLI)部署、代码部署 (CloudFomation、Terraform等)、以及其它开发语言(SDK)完成作业。
步骤一:登录 AWS 管理控制台
使用具有相应权限的账号登录 AWS 管理控制台,进入 CloudWatch 控制台页面。
步骤二:创建警报
在 CloudWatch 控制台中,选择“警报”选项,点击“创建警报”。
步骤三:选择指标
在“选择指标”页面,找到与 EC2 配额相关的指标类别,例如在“By Auto Scaling Group(这里也可能有按服务类别等划分,需准确找到 EC2 配额指标)”等相关路径下,选择具体要监控的配额指标,如特定实例类型的已使用配额占比指标。
步骤四:设置警报条件
定义警报触发的条件,例如当指标值达到 80% 时触发警报。
步骤五:配置通知
选择接收警报通知的 SNS 主题(需提前创建好用于接收警报通知的 SNS 主题),以便相关人员能及时收到配额警报信息。
步骤六:完成创建
确认警报配置信息无误后,点击“创建警报”完成设置。
1. 主动触发配额接近阈值的情况
快速启动接近配额限制数量的实例,观察是否能够及时收到 SNS 通知。
2. 查看 CloudWatch 监控指标的变化
在 CloudWatch 警报页面,查看该警报的状态是否随着配额使用情况的变化而正常变化。当配额使用达到预设阈值时,警报状态应变为“ALARM”状态。
3. 确认相关人员收到报警通知。
通过验证,确保 CloudWatch 对 EC2 配额的监控和警报功能正常工作,为业务的稳定运行提供保障。