pile·
백엔드·SSG.COMSSG.COM·

“장보기 지원금이 곧 소멸돼요” 알림 뒤에서 일어난 일

SSG.COM 의 장보기 지원금 소멸 알림 배치가 수십만 건을 병렬 발송하다 간헐적으로 "Connection is not available, request timed out"으로 실패한 문제를, Spring Batch 의 DB 커넥션 점유 구조를 손봐 해결한 사례를 다룬다. 발송 API 가 느린 게 아니라, 발송 응답을 기다리는 동안 DB 커넥션을 계속 붙잡는 chunk 구조가 진짜 원인이었다.

핵심 포인트
  • 대량 알림을 병렬 처리하자 여러 chunk 가 동시에 발송 API 응답을 기다리며 커넥션 풀을 고갈시켜 배치가 실패했다.
  • 병목은 발송 API 속도가 아니라, chunk 가 메시지 발송 대기 구간에도 DB 커넥션을 점유하는 구조였다.
  • Spring Batch 의 ResourcelessTransactionManager 로 chunk 트랜잭션이 DB 리소스를 직접 관리하지 않게 바꿨다.
  • DB 사용 구간과 발송 대기 구간을 분리해, 발송을 기다리는 동안 커넥션을 점유하지 않도록 했다.
  • 발송 API 자체는 그대로 두고 커넥션 점유 범위만 줄여 안정성을 확보했다.
상세 정리
  • 배경: 장보기 지원금 소멸 알림을 수십만 건 발송하는데, 단일 흐름이 느려 병렬 처리를 도입했더니 간헐적 배치 실패가 생겼다.
  • 증상: "Connection is not available, request timed out"으로 DB 커넥션 타임아웃이 발생했다.
  • 기존 구조: Spring Batch chunk(Reader→Processor→Writer)에서 DB 리소스 점유 → 메시지 생성 → 발송 API 호출·응답 대기까지 한 트랜잭션이 커넥션을 계속 붙잡았다.
  • 원인: 대량 발송에 병렬 처리가 겹치며 여러 chunk 가 동시에 API 응답을 기다려 커넥션 풀 부담이 급증했다.
  • 해결: ResourcelessTransactionManager 를 적용해 chunk 트랜잭션이 DB 리소스를 직접 관리하지 않게 하고, DB 사용 구간과 발송 대기 구간을 명확히 분리했다.
  • 개선 흐름: DB 리소스 사용 후 커넥션을 반환하고, 그다음 메시지 생성·발송 대기는 커넥션을 비점유 상태로 진행한다.
  • 효과: 커넥션 점유 시간이 줄어 풀 부담이 완화되고 병렬 처리 시 배치 실패가 감소했다.
왜 읽나Spring Batch 로 외부 API 호출이 포함된 대량 발송을 처리하는 백엔드 개발자에게, 커넥션 점유 범위를 줄여 풀 고갈을 막는 패턴 레퍼런스.
SSG.COM
SSG.COM 블로그
원문은 여기서 이어서 읽을 수 있어요
원문 읽기
읽음 (0)

이 글과 비슷한

  1. 백엔드·cloudflare-blogCloudflare Blog·

    hyper HTTP 라이브러리의 버그를 발견한 방법

    Cloudflare의 Images 서비스를 Unix 소켓 기반 아키텍처로 재구성한 후, 대용량 이미지 응답이 중간에 잘리는 버그가 발생했다. 14.8MB 응답에서 219KB만 전달되고 HTTP 200 OK는 정상 반환되어 애플리케이션 레벨에서 탐지가 불가능했다. 원인은 hyper 라이브러리의 dispatch 루프에서 flush 완료 여부를 확인하지 않고 연결을 종료하는 경쟁 조건이었으며, strace로 커널 호출 순서를 추적해 root cause를 특정했다. 최종 수정은 upstream PR #4018로 hyper 레포에 병합됐다.

    #rust#debugging#race-condition+2
  2. 백엔드·stackoverflow-blogStack Overflow Blog·

    CherryScript — 데이터 파이프라인을 위한 커스텀 Python 인터프리터 설계

    CherryScript는 데이터 기반 워크플로우 최적화를 위한 커스텀 DSL로, Python 기반 인터프리터로 구현됐다. 일반 Python 인터프리터의 메모리 병목과 AST 트리워킹 성능 문제를 극복하기 위해 스트리밍 렉서, 바이트코드 컴파일, 불변 상태 관리의 세 가지 최적화 전략을 채택했다.

    #dsl#python#interpreter+2