Strands Agents SDK 実践 — メトリクスでエージェントを最適化する
Strands Agents SDK の result.metrics を深掘りし、サイクル数・トークン量・ツール実行時間を分析する。ツール設計の違いがパフォーマンスに与える影響をメトリクスで比較し、エージェントの最適化ポイントを特定する。
MCP・A2A・LLMオーケストレーションによるAIエージェントの構築と運用に関する記事
Strands Agents SDK の result.metrics を深掘りし、サイクル数・トークン量・ツール実行時間を分析する。ツール設計の違いがパフォーマンスに与える影響をメトリクスで比較し、エージェントの最適化ポイントを特定する。
Strands Agents SDK に Bedrock Guardrails を適用し、エージェントの入出力を自動フィルタリングする。ガードレール発動時の挙動と、Hooks を使ったシャドーモード(監視のみ)の実装をコードで確認する。
Strands Agents SDK の Hooks でエージェントループに処理を差し込む。ツール呼び出しのログ記録、回数制限、結果の加工を実際のコードで確認し、エージェントの動作をリアルタイムで制御する方法を学ぶ。
Strands Agents SDK の FileSessionManager で会話をファイルに永続化し、プロセス再起動後も復元できることを確認する。保存されるデータ構造と S3 への切り替え方法もコードで解説する。
Strands Agents SDK の Structured Output を実際に動かし、Pydantic モデルで LLM の出力を型安全なオブジェクトに変換する。ツールとの併用やバリデーション自動リトライの仕組みをコードとメトリクスで確認する。
DevOps Agent の Generic Webhook を使い、CloudWatch アラーム → SNS → Lambda → Webhook で調査を自動起動するパイプラインを構築した。HMAC 署名の実装、アラーム発火から調査開始までの所要時間、同一 incidentId 送信時のリンク動作を検証する。
DevOps Agent の EventBridge 連携を検証。Investigation のライフサイクルイベントをキャプチャし、調査サマリを SNS で自動通知するパイプラインを構築した。IAM アクションプレフィックスや Lambda の boto3 バンドルなど、ドキュメントだけでは分からない実装上の注意点も記録する。
AWS Security Blogの金融サービス向けエージェント型AIセキュリティ記事を解説。7つの設計原則を「権限」「追跡」「制御」の3軸で整理し、Bedrock AgentCoreによる実装アプローチを示す。
AWS ブログで紹介された AI 駆動 A/B テストエンジンの核心 — Bedrock Converse API の tool use を活用したモデルによる意思決定 — を実装・検証。プロンプトに含める文脈情報の有無でバリアント選択が逆転する現象を確認し、tool use でモデルに意思決定させる際の設計指針を整理した。
AgentCore Runtimeに追加されたマネージドセッションストレージを検証。停止・再開後のファイル復元、pip/gitワークスペースの永続化、セッション間隔離、グレースフルシャットダウンの挙動を実測データとともに共有する。