pile·
DB / 데이터·부스트브라더스부스트브라더스·

MongoDB Timeseries를 활용기

문제레거시 로그 서버가 시계열 데이터를 일반 컬렉션에 저장해 시간 경과에 따른 조회 성능이 저하됐다.
접근MongoDB 5.x의 Timeseries Collection을 도입해 Bucket Pattern으로 시간 범위별 데이터를 그룹화했다. 유저 행동과 데이터 변경 이력으로 분류하고 URN 규칙과 6개월 TTL 정책을 적용했다.
결과시간 기준 인덱싱으로 시계열 조회 성능이 향상됐고, Bucket Pattern 자동화로 별도 구현 없이 효율적인 로그 저장이 가능해졌다.
부스트브라더스
부스트브라더스 블로그
원문은 여기서 이어서 읽을 수 있어요
원문 읽기
읽음 (0)

이 글과 비슷한

  1. DB / 데이터·pinterest-engPinterest Engineering·

    Pinterest 차세대 DB 수집 프레임워크의 자동화된 스키마 진화

    Pinterest의 CDC 기반 DB 수집 파이프라인은 MySQL에서 Kafka, Flink, Spark, Iceberg를 거치는 다층 구조다. 스키마 변경이 생기면 모든 계층을 동시에 업데이트해야 해 드리프트, 배포 실패, 데이터 불일치가 반복됐다. Pinterest 엔지니어링 팀은 이를 해결하기 위해 가산적 변경만 자동화하는 스키마 진화 프레임워크를 구축하고, PR 기반 롤아웃과 SLA 기반 일관성 모델을 도입했다.

    #data-pipeline#apache-flink#cdc+2