CloudFormation スタックが DELETE_FAILED で残ると eksctl create cluster が失敗する
eksctl create cluster が AlreadyExistsException で失敗する場合、DELETE_FAILED 状態の CloudFormation スタックが残っている可能性がある。手動で削除すれば解決する。
Today I Learned — 日々の学びを記録
eksctl create cluster が AlreadyExistsException で失敗する場合、DELETE_FAILED 状態の CloudFormation スタックが残っている可能性がある。手動で削除すれば解決する。
EKS Auto Mode(Karpenter)は空ノードを DisruptionTerminating: Empty で自動ターミネートする。コスト最適化のための正常な挙動。
EKS Cluster Insights は kubelet version skew やアドオン互換性の問題を自動検出する。kubent/pluto と併用するとアップグレード判断が楽になる。
ソースを tar.gz にして S3 にアップロードし、Kaniko Job の --context=s3:// で指定すれば EKS 上で Docker デーモンなしにイメージビルド・ECR push が完結する。
kubent は Cluster コレクターに加えて Helm v3 コレクターでリリースシークレットもスキャンする。pluto の detect-all-in-cluster は live リソースのみ。
hostname だけだと同一 AZ 内の別ノードに分散するだけ。topology.kubernetes.io/zone を追加して AZ 間分散を保証する。
EKS クラスターを削除しても自動作成された VPC エンドポイントが残り、ENI が in-use のまま VPC 削除が DependencyViolation で失敗する。VPC エンドポイントを明示的に削除し、ENI 解放を待つ。
AgentCore Runtime が VPC 内に作成した ENI は destroy 後も数時間 in-use のまま残ることがある。サブネットや VPC の削除は ENI が available になってから再試行する。
ArgoCD Application を kubectl delete しても Pod や Service は消えない。カスケード削除には resources-finalizer.argocd.argoproj.io の設定が必要。
Identity Center はグローバルに見えるが実体は特定リージョンにある。EKS Capabilities の idcRegion を間違えると AccessDeniedException になる。