pile·
백엔드·라포랩스 (퀸잇)라포랩스 (퀸잇)·

퀸잇 검색 시스템의 여정: WHERE title LIKE '%keyword%'에서 Hybrid Search까지

문제라포랩스 퀸잇이 2020년 출시 당시 검색 기능 자체가 없었고, MySQL LIKE 로 시작한 검색이 패션 커머스 트래픽/개인화/시맨틱 요구를 못 따라잡았다.
접근박서준 엔지니어가 5년 진화 과정 정리. MySQL LIKE → 4시간 만에 Elasticsearch 전환(한국어 형태소 + 역인덱스), function_score 로 구매량/CTR/거래액 같은 비즈 지표 리랭킹, 사용자/상품 임베딩 벡터 검색 + 시맨틱 검색 추가, BM25/개인화 벡터/시맨틱을 RRF 로 통합.
결과Hybrid Search 로 텍스트+개인화+시맨틱 일관 랭킹. 럭퀸세일 장애로 서킷 브레이커/다단계 Fallback 필요성 확인. ES KNN 통합, ML 리랭킹, Query Understanding 이 다음 단계.
라포랩스 (퀸잇)
라포랩스 (퀸잇) 블로그
원문은 여기서 이어서 읽을 수 있어요
원문 읽기
읽음 (0)

이 글과 비슷한

  1. 백엔드·cloudflare-blogCloudflare Blog·

    hyper HTTP 라이브러리의 버그를 발견한 방법

    Cloudflare의 Images 서비스를 Unix 소켓 기반 아키텍처로 재구성한 후, 대용량 이미지 응답이 중간에 잘리는 버그가 발생했다. 14.8MB 응답에서 219KB만 전달되고 HTTP 200 OK는 정상 반환되어 애플리케이션 레벨에서 탐지가 불가능했다. 원인은 hyper 라이브러리의 dispatch 루프에서 flush 완료 여부를 확인하지 않고 연결을 종료하는 경쟁 조건이었으며, strace로 커널 호출 순서를 추적해 root cause를 특정했다. 최종 수정은 upstream PR #4018로 hyper 레포에 병합됐다.

    #rust#debugging#race-condition+2
  2. 백엔드·stackoverflow-blogStack Overflow Blog·

    CherryScript — 데이터 파이프라인을 위한 커스텀 Python 인터프리터 설계

    CherryScript는 데이터 기반 워크플로우 최적화를 위한 커스텀 DSL로, Python 기반 인터프리터로 구현됐다. 일반 Python 인터프리터의 메모리 병목과 AST 트리워킹 성능 문제를 극복하기 위해 스트리밍 렉서, 바이트코드 컴파일, 불변 상태 관리의 세 가지 최적화 전략을 채택했다.

    #dsl#python#interpreter+2