Info
25년 7월 작업 중 겪었던 내용을 간략하게 요약한 글입니다.
문제 상황
일부 AWS Application Load Balancer (ALB)가 갑자기 작동하지 않는 문제가 있었습니다.
해당 서비스는 내부용이었고, 장애 상황 동안 브라우저 등에서 서비스에 접근할 수 없었습니다.
문제 원인
조사 결과, ALB에 단일 서브넷만 연결되어 있었고, 해당 Availability Zone (AZ)이 변경되면서 ALB가 작동하지 않게 되었습니다. 해당 내용은 Reachability Analyzer와 ALB 설정을 조사해 확인할 수 있었습니다.
Target is in an Availability Zone that is not enabled for the load balancer
ALB는 고가용성을 위해 최소 2개 이상의 AZ에 분산 배치되어야 하는데, 단일 AZ에만 의존하고 있어 AZ 변경 시 서비스 중단이 발생했습니다.
해결 방법
ALB에 모든 AZ(3개)에 대해 서브넷을 연결하여 다중 AZ 구성으로 변경하였고, 문제가 해결되었습니다.
해당 리소스는 이전에 인프라가 고도화되지 않았을 때 수동으로 생성된 리소스였습니다.
최근에는, 특히 Terraform 모듈 등을 사용할 경우 기본으로 다중 AZ 구성이 되어 있습니다.