@shinyaz

ブログ

すべてのブログ記事一覧

ブログ

Bedrock の tool use で AI 駆動 A/B テストの意思決定エンジンを検証する

AWS ブログで紹介された AI 駆動 A/B テストエンジンの核心 — Bedrock Converse API の tool use を活用したモデルによる意思決定 — を実装・検証。プロンプトに含める文脈情報の有無でバリアント選択が逆転する現象を確認し、tool use でモデルに意思決定させる際の設計指針を整理した。

約16分
ブログ

Bedrock AgentCore Runtimeのマネージドセッションストレージでエージェントの作業状態を停止・再開をまたいで永続化する

AgentCore Runtimeに追加されたマネージドセッションストレージを検証。停止・再開後のファイル復元、pip/gitワークスペースの永続化、セッション間隔離、グレースフルシャットダウンの挙動を実測データとともに共有する。