pile·
AI / ML·vercel-blogVercel Blog·

임베딩 없이 지식 에이전트 구축하기 — 파일시스템 기반 RAG 대안

임베딩과 벡터 DB 없이 파일시스템 bash 명령으로 지식 에이전트를 구현하는 접근을 제안한다. LLM이 파일 탐색과 grep/find/cat에 능숙하다는 점을 활용해 벡터 유사도 대신 실제 bash 명령으로 콘텐츠를 검색하게 한다. 기존 RAG 파이프라인 대비 비용을 $1.00 → $0.25로 줄이고 디버깅 가시성을 높였다.

핵심 포인트
  • 임베딩 대신 grep/find/cat — LLM이 벡터 스코어 대신 실제 bash 명령으로 파일 탐색
  • 투명성: 에러 시 "grep -r 'pricing' docs/ 실행 → enterprise.md 읽음" 처럼 정확히 추적 가능
  • 비용 75% 감소: 세일즈 콜 요약 에이전트 $1.00 → $0.25/회
  • Complexity Router: 단순 질의는 저비용 빠른 모델, 복잡한 질의는 강력한 모델로 자동 분기
  • Chat SDK로 GitHub, Discord, Slack, Teams 등 여러 플랫폼 동시 배포
상세 정리
  • 문제: 기존 벡터 DB RAG는 임베딩 파이프라인 튜닝이 복잡하고, 결과가 왜 선택됐는지 벡터 스코어로 추적하기 어렵다.
  • 핵심 아이디어: LLM은 방대한 코드 학습 데이터 덕분에 디렉토리 탐색과 파일 처리에 이미 능숙하다. 별도 임베딩 없이 기존 능력 활용.
  • 아키텍처: 콘텐츠 소스를 Postgres 저장 → Vercel Workflow로 스냅샷 저장소와 동기화 → 질의 시 Vercel Sandbox가 스냅샷 로드 → bash 도구(grep, find, cat) 실행.
  • 벡터 vs 파일시스템: 임베딩은 블랙박스 유사도 스코어와 파라미터 튜닝 필요. 파일시스템은 실제 bash 명령으로 가시적 추적, 설정 없이 동작.
  • 비용 절감: 세일즈 콜 요약 에이전트에서 연산당 $1.00 → $0.25 — 75% 감소.
  • Complexity Router: 단순 질문은 빠르고 저렴한 모델, 복잡한 질문은 강력한 모델로 자동 분기해 비용 최적화.
  • 디버깅 예시: "grep -r 'pricing' docs/ 실행 → docs/plans/enterprise.md 읽음 → 잘못된 섹션 가져옴"처럼 정확히 추적. 벡터 스코어 추측 불필요.
  • 멀티플랫폼: Chat SDK로 같은 에이전트를 GitHub, Discord 기본 제공, Slack/Teams/Google Chat 어댑터 추가 가능.
  • Admin Agent: "최근 24시간 에러 뭐야?" 같은 자연어로 내부 도구 조회 가능한 관리자 에이전트 내장.
왜 읽나벡터 DB 없이 투명하고 디버그 가능한 지식 에이전트를 구축하려는 AI 엔지니어에게 파일시스템 기반 RAG 대안의 실전 구현 레퍼런스.
vercel-blog
Vercel Blog 블로그
원문은 여기서 이어서 읽을 수 있어요
원문 읽기
읽음 (0)

이 글과 비슷한

  1. AI / ML·인프랩 (인프런)인프런 (인프랩)·

    학습 에이전트 — AI 두뇌 구축하기

    인프런이 강의 학습 에이전트를 구축하며 겪은 기술 스택 선정, 컨텍스트·도구 설계, LLM-as-a-Judge 품질 개선, 비용 최적화 전략을 다룬다. LLM SSE 스트리밍 처리를 위해 Spring MVC + Virtual Thread + Spring AI를 선택하고, 명시적 프롬프트 캐싱으로 입력 토큰을 90% 절감하는 과정까지 실전 경험이 담겨 있다.

    #ai-agent#llm#llm-as-a-judge+2
  2. AI / ML·네이버 D2네이버 D2·

    AI 에이전트 회사 차리기: 설립부터 어디서든 동기화까지

    네이버 ENGINEERING DAY 2026 발표. Claude Code를 매일 쓰지만 매번 초기화되는 문제를 해결하기 위해 NaverMadCat이라는 다중 AI 에이전트 조직 프레임워크를 구축한 경험을 다룬다. 비서실장 역할의 에이전트가 10개 부서 에이전트를 조율하며, 어느 환경에서 접속해도 동일한 컨텍스트로 동작하도록 동기화 메커니즘을 구현했다.

    #claude-code#multi-agent#ai-agent+2
  3. AI / ML·vercel-blogVercel Blog·

    AI Gateway에서 실시간 음성 에이전트 구축하기

    Vercel AI Gateway가 음성·오디오 기능을 정식 지원한다. 실시간 대화 음성(Realtime Voice), 텍스트→음성(TTS), 음성→텍스트(STT) 세 가지를 기존 텍스트/이미지 모델과 동일한 라우팅·인증·모니터링 체계 위에서 사용할 수 있다. OpenAI gpt-realtime-2·Whisper와 xAI Grok 오디오 모델을 지원하며, AI SDK 7 베타로 제공된다.

    #llm-app#ai-sdk#realtime-voice+2