다나와 검색의 색인 최적화 사례

문제다나와 검색은 에누리 통합으로 10억 건 넘는 상품 데이터를 다루게 되면서 Elasticsearch CPU가 100%에 닿고 힙 부족·색인 요청 거절·정합성 문제가 동시에 터졌다.

접근건 바이 건 색인을 BulkProcessor API로 묶고 0.2초 간격 CPU 모니터링 기반 백프레셔를 추가, Express 프록시로 12대 색인 서버의 중복 조회를 정리하고 데이터 노드와 코디네이터 노드를 분리해 라우팅을 떼어냈다.

결과피크 CPU가 70%에서 30%대로 떨어지고 운영 환경 CPU가 80% 이하로 유지됐으며, 1,000만 건 14분 처리 성능을 유지하면서 연결 끊김 문제까지 해소됐다.

다나와 블로그

원문은 여기서 이어서 읽을 수 있어요

읽음 (0)

이 글과 비슷한