45분 배치에서 준실시간으로! 다수 도메인 데이터를 Kafka로 통합한 전환기
10년 누적 프로시저 기반 배치로 혜택 정보가 최대 45분 지연돼 고객 경험이 저하됐다.
10년 누적 프로시저 기반 배치로 혜택 정보가 최대 45분 지연돼 고객 경험이 저하됐다.
개발 조직이 AI 를 개인 도구가 아닌 조직 차원의 협업 방식으로 내재화하는 방법이 없었다.
개발 로그상으로는 정상인데 고객 화면에서는 장애가 보이는 케이스가 누적돼 인프라 장애 대응이 어려웠다.
MSA 환경에서 프로모션·픽업 주문 등 흩어진 도메인 데이터를 통합하면서 API 호출 부하를 최소화해야 했다.
물류 센터를 확장해도 단일 센터 중심의 경직된 주문 처리와 수작업 분배 때문에 새 센터가 활용되지 못했다.
올리브영 앱의 매장 서비스가 파편화돼 고객이 오프라인 매장의 프로모션과 경험을 인지하지 못해 방문 유도가 어려웠다.
레거시 알림톡 발송 로직이 여러 비즈니스 코드에 산재되고 데이터 조회 기준이 달라 일관성이 부족했다.
1,300 개 매장 전자라벨 배치 처리에 13.5 일이 걸렸고 트래픽 폭주 시 DB 성능이 무너졌다.
1,300 개 매장의 수백만 종이라벨을 수동 관리하면서 프로모션 기간 업무 과중과 재고 정보 지연이 반복됐다.
레거시 세션 기반 인증의 확장성과 보안 한계를 해소하면서 대규모 트래픽 환경에서 무중단으로 전환해야 했다.
상용 LLM API 의 높은 비용과 예측 불가능한 성능 변화가 운영 부담이 됐다.
서브타입 관계 없는 타입들에 동일 로직을 적용할 때 타입별 중복 함수를 만들어야 한다.
SQS 이벤트 기반 알림톡 시스템 전환 후 HikariPool 커넥션 데드락(30,000ms 타임아웃)이 발생했다.
ODI 기반 배치 동기화(20분~1시간 주기)로 고객의 마케팅 동의 철회·쿠폰 발급이 즉시 반영되지 않아 타겟팅 오류와 소스 DB 과부하가 발생했다.
백오피스에서 사용자 권한별(본사/매장/협력사)로 다른 보안 솔루션을 적용해야 하는데 수십 개 다운로드 API마다 중복 로직이 필요했다.
Android·iOS 앱이 동일한 식별자를 사용해 한 기기에 개발·운영 앱을 동시 설치할 수 없어 환경 혼동에 따른 휴먼 에러와 커뮤니케이션 비용이 발생했다.
외부 온콜 솔루션이 해외 번호 발신으로 스팸 차단되고 간헐적 발신 실패 + 월 200만 원 고정 비용이 발생했다.
2025 QA Korea Conference에 공식 후원사로 참여해 500명 앞 발표와 부스 운영을 5명이 소화해야 했다.
Oracle 함수 직접 호출 구조로 DB 과부하가 발생하고 대규모 트래픽(올영세일) 시 품절 정보 조회가 지연돼 서비스 품질이 저하됐다.
선착순 쿠폰 발급 시 Redis GET/INCR 원자성 부재로 경합 상태가 발생해 발급 성공 응답에도 실제 미발급이 남았다(미발급률 0.014%).