@shinyaz

ArgoCD の IAM エラーは手動 refresh しないとリカバリが遅い

約1分

EKS ArgoCD Capability で CodeCommit 連携を試していたとき、codecommit:GitPull を付与し忘れた状態で Application を作成してしまった。AccessDeniedExceptionstatus.conditions に表示されたので、IAM ポリシーを追加して待ったが、約90秒経っても同じエラーが出続けた。

ArgoCD はエラー発生時にリトライ間隔をバックオフする仕組みがあるため、ポリシー修正後もすぐには再試行されない。手動で hard refresh を実行したら約15秒でデプロイが始まった。

Terminal
kubectl annotate application <app-name> -n argocd \
  argocd.argoproj.io/refresh=hard --overwrite

IAM 周りのエラーを修正したら、ポーリングを待たずにこのアノテーションで即座にリトライするのが確実だ。検証の詳細はこちら

共有する

田原 慎也

田原 慎也

ソリューションアーキテクト @ AWS

AWS ソリューションアーキテクトとして金融業界のお客様を中心に技術支援をしており、クラウドアーキテクチャや AI/ML に関する学びをこのサイトで発信しています。このサイトの内容は個人の見解であり、所属企業の公式な意見や見解を代表するものではありません。