公式ベストプラクティスでエージェントスキルをリファクタリングする
Anthropicの公式ベストプラクティス2つを実際のスキルセットに適用し、予約語違反・命名規則・progressive disclosureの3点を改善した。自作の分析スキルでセルフチェックする手法も紹介する。
すべてのブログ記事一覧
Anthropicの公式ベストプラクティス2つを実際のスキルセットに適用し、予約語違反・命名規則・progressive disclosureの3点を改善した。自作の分析スキルでセルフチェックする手法も紹介する。
Bedrock AgentCore PolicyのGA発表を受け、CedarポリシーによるGatewayのツールアクセス制御と自然言語からのCedar生成を実際に検証。default denyや自動推論バリデーションの挙動を実体験ベースで共有する。
macOS/Linux両対応のdotfilesをXDG準拠・1Password SSH統合・テストスクリプト付きで構築した。シンボリックリンクではなくコピー方式を選んだ設計判断と、AIエージェントにメンテさせる仕組みも紹介する。
AIコーディング成熟度モデルを実務に落とし込む。30日アクションプラン、レビューガイドライン策定、組織横断メトリクスの始め方、四半期レビューの回し方を解説。
AnthropicやOpenAIの既存フレームワークを踏まえ、ソフトウェア開発チームに特化したAIコーディング成熟度モデルを定義する。5段階の各レベルで何が変わり、何を整備すべきかを示す。
Lambda Managed Instances の Rust サポートを検証。run_concurrent で8並列処理を実現し、Init Duration 2.9msでコールドスタートを実質排除。通常Lambdaとの使い分けを考察する。
AgentCore Memory の新機能 Memory Record Streaming を検証。Kinesis Data Streams へのプッシュ配信、FULL_CONTENT / METADATA_ONLY の挙動差、非同期抽出イベントの実測結果を共有する。
複数のコーディングエージェントのメトリクスを共通スキーマで正規化し、横断ダッシュボードで可視化する設計。比較可能な指標と不可能な指標の分離が、ミスリードを防ぐ鍵になる。
AgentCore Runtimeに追加されたStateful MCP機能を検証。Elicitation(サーバー主導の入力取得)、Sampling(LLM生成要求)、Progress Notifications(進行状況通知)の実挙動をローカルとリモートの両方で確認した。
CLAUDE.mdをKiroのステアリングに、スキルをAgent Skillsに変換した。最大の発見はKiroのスキルがagentskills.io標準に準拠しており、Claude Codeのスキルをそのままコピーできること。