Oracle에서 MongoDB로의 CDC Pipeline 구축

문제카카오페이증권이 MSA를 확장하면서 Oracle과 MongoDB 사이의 실시간 데이터 동기화가 필요해졌다. RDBMS에서 NoSQL로 가는 CDC는 참고할 사례가 적었고, 초기 적재와 변경 이벤트를 함께 다뤄야 했다.

접근Kafka Connect 위에 Debezium Source Connector와 MongoDB Sink Connector로 파이프라인을 만든다. 초기 6TB는 Talend Open Studio와 mongoimport로 분리 적재하고, 그 뒤 변경분은 Kafka 이벤트로 실시간 동기화했다.

결과6TB·130억 건의 초기 데이터를 9일 만에 적재했고, 누적된 변경분 lag도 12시간 안에 따라잡았다. 이후 안정 운영 중이다.