ブログ
AWS DevOps Agent 検証 — EKS ナレッジグラフで Kubernetes 障害の根本原因を自動特定する
DevOps Agent の EKS 統合を検証。Learned Topology による Kubernetes オブジェクトの自動検出、アプリ障害とインフラ障害での調査プロセスの違い、audit ログからの操作者特定能力を実測データで評価する。
「sre」タグが付いたコンテンツ一覧
DevOps Agent の EKS 統合を検証。Learned Topology による Kubernetes オブジェクトの自動検出、アプリ障害とインフラ障害での調査プロセスの違い、audit ログからの操作者特定能力を実測データで評価する。
DevOps Agent の予防機能に複数パターンのインシデント調査履歴を与え、手動評価を実行した。生成された推奨事項の内容・カテゴリ・エージェント対応スペックの有無を確認し、予防提案の実態を明らかにする。
DevOps Agent のスキルを作成し、同一インシデントシナリオでスキルあり/なしの調査結果を比較した。調査時間が 164秒→64秒に短縮され、報告フォーマットがスキルの指示に従った構造化された形式に変化した。
AWS DevOps Agent を東京リージョンでゼロからセットアップし、インシデント自動調査と Chat 機能を検証した。CLI で66秒でセットアップ完了、Chat は stress-ng の根本原因を正確に特定した。