Info
25년 6월 작업 내용을 간단히 요약한 글입니다.
문제 상황
EKS 노드의 디스크 사용량이 높아 알람이 발생하여 조사를 진행하였습니다.
이미 EBS 볼륨은 충분히 할당해 놓은 상태였습니다.
원인
디스크가 찬 부분을 확인해 보니, Bottlerocket OS의 루트 볼륨이었습니다.
조사 결과 Bottlerocket OS의 루트 볼륨은 할당한 EBS에 관계없이 고정되어 있고, 그 공간을 시스템 이미지가 차지하고 있었습니다.
GitHub 이슈에서도 관련 내용을 찾아볼 수 있었고1, 다른 Pod를 직접 확인했을 때도 용량이 고정되어 있었습니다.
그 외 용량을 많이 차지하는 파일은 발견되지 않았습니다.
해결 방법
다른 사례를 찾아보았을 때도 Bottlerocket OS의 설계상의 특성으로 인한 것으로 판단되었습니다. 또한 해당 노드는 실제 서비스를 배포한 후 몇 주간 문제가 없었기 때문에, 알람을 비활성화하기로 결정했습니다.