pile·
인프라 / DevOps·당근당근 테크블로그·

Job 워크로드를 위한 EKS Node Group 오토스케일링 도입기

문제batch Job 워크로드는 짧고 변동성이 크다. EKS Node Group 을 정적으로 두면 유휴 노드 비용이 크고, 작게 두면 Job 시작 latency 가 SLO 를 벗어난다.
접근당근이 cluster autoscaler / Karpenter 기반 오토스케일링을 적용. Job 패턴에 맞춰 빠르게 노드를 띄우고 idle 시 빠르게 회수한다.
결과유휴 비용 줄이면서 Job 시작 latency 를 SLO 안으로 유지. AI 학습 같은 burst 워크로드에도 적용 가능.
당근
당근 테크블로그 블로그
원문은 여기서 이어서 읽을 수 있어요
원문 읽기
읽음 (0)

이 글과 비슷한

  1. 인프라 / DevOps·vercel-blogVercel Blog·

    Vercel CLI 드라이런 배포로 실제 배포 전 구성 미리 확인하기

    Vercel CLI v54.17.2부터 vercel deploy --dry 명령으로 실제 파일 업로드 없이 배포 구성을 미리 검사할 수 있다. 프레임워크 감지 결과, 포함/제외 파일 목록, 디렉터리 크기 분포, 콘텐츠 해시까지 사전에 확인하고 나서 배포를 결정할 수 있어 의도치 않은 배포 실패를 예방한다.

    #deployment#ci-cd#vercel-cli+1