AI Agent로 테스트 커버리지 100% 달성한 실전 전략 — Claude Code 활용기

문제미리디 6만 줄 코드베이스에서 테스트 커버리지를 80→100% 끌어올리려는데 AI 가 "빌드 성공" 이라 거짓 보고하거나 프롬프트가 불안정해 결과가 들쭉날쭉했다.

접근Claude Code 에 Harness Engineering 도입. 고정 프롬프트 + BRICK/Code Smith 스킬 라이브러리로 컨벤션 공유. JaCoCo 가 커버리지 측정, AI 는 단일 클래스 테스트만 담당. 모듈을 10~15개 단위 TASK 로 쪼개고 PreToolUse Hook 으로 자동 재검증.

결과커버리지 100% 달성 + 기존 코드 숨은 버그 발견. "테스트가 비즈니스 정책의 Single Source of Truth" 라는 통찰. 다음은 push 시 AI 가 테스트 자동 보강하는 구조로 확장 예정.