その他サービス ・
CloudWatch Alarms とは?メトリクス監視と自動アクション
CloudWatch Alarms は メトリクスを監視し、設定したしきい値を超えたら自動的にアクションを実行する仕組み。SNS 通知・Auto Scaling のスケーリング・EC2 の停止等、AWS 運用の自動対応の中核。 ---
メトリクスのしきい値を監視し、超過時にアクションを実行するアラーム機能。
1. 概要(端的に)
CloudWatch Alarms は メトリクスを監視し、設定したしきい値を超えたら自動的にアクションを実行する仕組み。SNS 通知・Auto Scaling のスケーリング・EC2 の停止等、AWS 運用の自動対応の中核。
2. 何ができるか
- しきい値監視:CPU・メモリ・カスタムメトリクス
- 複数の状態:OK / ALARM / INSUFFICIENT_DATA
- アクション:SNS 通知 / EC2 アクション / Auto Scaling
- 複合アラーム:複数アラームの AND/OR
- 異常検知:機械学習でベースライン自動学習
3. 特徴
| 観点 | 特徴 |
|---|---|
| 追加料金 | アラーム単位(標準)+ 機械学習別途 |
| 状態 | OK / ALARM / INSUFFICIENT_DATA |
| 粒度 | 60 秒〜(高分解能 10 / 30 秒) |
| 評価期間 | N データポイント中 M 個でトリガー |
4. 仕組み
Alarms は メトリクスを定期的に評価し、条件に合致すると アラーム状態 に遷移。アクション(SNS 等)を実行する。
状態遷移
[OK]
↓ しきい値超過 (M of N)
[ALARM]
→ SNS 通知 / Auto Scaling / etc
データなし
→ [INSUFFICIENT_DATA]
異常検知(Anomaly Detection)
- 機械学習でメトリクスの正常範囲を学習
- 範囲外なら ALARM
- 「CPU 80%」固定しきい値より柔軟
5. ユースケース
ユースケース 1:障害検知
EC2 ステータスチェック失敗 → SNS → 運用者通知。
ユースケース 2:Auto Scaling トリガー
CPU > 70% → スケールアウト、< 30% → スケールイン。
ユースケース 3:コスト監視
請求額アラームで予算超過防止。
ユースケース 4:アプリ品質
エラー率 > 1% でアラート。
6. 関連用語
- CloudWatch — メトリクス基盤
- CloudWatch-Logs — メトリクスフィルターから
- SNS — 通知先
- EC2-Auto-Scaling — アクション
7. 関連サイト
🎓 試験での出題傾向
| 試験 | 重要度 | 主な出題パターン |
|---|---|---|
| CLF | 中 | アラームの概念 |
| SAA | 高 | 監視設計、Auto Scaling 連携 |
| DVA | 中 | アプリ監視実装 |
| SOA | 高 | 運用設計(頻出) |