AWS DevOps Agent 検証 — EKS ナレッジグラフで Kubernetes 障害の根本原因を自動特定する
DevOps Agent の EKS 統合を検証。Learned Topology による Kubernetes オブジェクトの自動検出、アプリ障害とインフラ障害での調査プロセスの違い、audit ログからの操作者特定能力を実測データで評価する。
「devops-agent」タグが付いたコンテンツ一覧
DevOps Agent の EKS 統合を検証。Learned Topology による Kubernetes オブジェクトの自動検出、アプリ障害とインフラ障害での調査プロセスの違い、audit ログからの操作者特定能力を実測データで評価する。
DevOps Agent の Generic Webhook を使い、CloudWatch アラーム → SNS → Lambda → Webhook で調査を自動起動するパイプラインを構築した。HMAC 署名の実装、アラーム発火から調査開始までの所要時間、同一 incidentId 送信時のリンク動作を検証する。
DevOps Agent の EventBridge 連携を検証。Investigation のライフサイクルイベントをキャプチャし、調査サマリを SNS で自動通知するパイプラインを構築した。IAM アクションプレフィックスや Lambda の boto3 バンドルなど、ドキュメントだけでは分からない実装上の注意点も記録する。
DevOps Agent の予防機能に複数パターンのインシデント調査履歴を与え、手動評価を実行した。生成された推奨事項の内容・カテゴリ・エージェント対応スペックの有無を確認し、予防提案の実態を明らかにする。
DevOps Agent のスキルを作成し、同一インシデントシナリオでスキルあり/なしの調査結果を比較した。調査時間が 164秒→64秒に短縮され、報告フォーマットがスキルの指示に従った構造化された形式に変化した。
AWS DevOps Agent を東京リージョンでゼロからセットアップし、インシデント自動調査と Chat 機能を検証した。CLI で66秒でセットアップ完了、Chat は stress-ng の根本原因を正確に特定した。
AWS DevOps Agent の IAM アクションプレフィックスは devops-agent ではなく aidevops。boto3 のクライアント名は devops-agent だがポリシーでは aidevops:* を指定する。AWS CLI は v2.34.20 以降で対応。
ドキュメントには Duplicate messages are deduplicated と記載されているが、実際には同一 incidentId の Webhook は既存の Investigation にリンクされ、リンク先の Investigation が再び In Progress に遷移する動作が確認された。