학습 에이전트 — AI 두뇌 구축하기
인프런이 강의 학습 에이전트를 구축하며 겪은 기술 스택 선정, 컨텍스트·도구 설계, LLM-as-a-Judge 품질 개선, 비용 최적화 전략을 다룬다. LLM SSE 스트리밍 처리를 위해 Spring MVC + Virtual Thread + Spring AI를 선택하고, 명시적 프롬프트 캐싱으로 입력 토큰을 90% 절감하는 과정까지 실전 경험이 담겨 있다.
인프런이 강의 학습 에이전트를 구축하며 겪은 기술 스택 선정, 컨텍스트·도구 설계, LLM-as-a-Judge 품질 개선, 비용 최적화 전략을 다룬다. LLM SSE 스트리밍 처리를 위해 Spring MVC + Virtual Thread + Spring AI를 선택하고, 명시적 프롬프트 캐싱으로 입력 토큰을 90% 절감하는 과정까지 실전 경험이 담겨 있다.
네이버 ENGINEERING DAY 2026 발표. Claude Code를 매일 쓰지만 매번 초기화되는 문제를 해결하기 위해 NaverMadCat이라는 다중 AI 에이전트 조직 프레임워크를 구축한 경험을 다룬다. 비서실장 역할의 에이전트가 10개 부서 에이전트를 조율하며, 어느 환경에서 접속해도 동일한 컨텍스트로 동작하도록 동기화 메커니즘을 구현했다.
Dropbox가 Dash Chat 에이전트의 응답 품질을 높이기 위해 DSPy 최적화 프레임워크를 도입한 과정을 다룬다. 인간 레이블로 LLM 평가자(judge)를 보정하고, 보정된 judge로 에이전트의 시스템 프롬프트를 자동 최적화하는 두 단계 전략으로 불완전 답변 26% 감소와 토큰 사용 5.4% 절감을 달성했다.
LY Corporation 의 Flava API Gateway 개발팀이 AI 코딩 에이전트 도입 후 직면한 "빠른 코드 생성 vs 느린 검증" 문제를 해결한 전략을 공유한다. 스펙 주도 개발, 검증 자동화, 로컬 환경 재현성의 세 축으로 접근해 AI 에이전트가 즉각적인 피드백 루프 안에서 안정적으로 작동할 수 있는 개발 기반을 구축했다.
LY Corporation 엔지니어링 팀이 단일 AI 에이전트 방식에서 Proposer-Challenger-Orchestrator 구조의 멀티 에이전트 협업 모델로 개발 프로세스를 재설계한 경험을 공유한다. AI-assist 환경에서 "개별 단계는 빠르지만 단계 간 사람 조율에서 병목"이 생기는 문제를 에이전트 간 구조화된 토론으로 해결했다.
네이버 ENGINEERING DAY 2026 발표. AI 코딩 에이전트와 그 실행 환경을 API로 추상화하고 관리할 수 있는 오픈소스 프레임워크 Kelos를 소개한다. 쿠버네티스 네이티브 설계로 코딩 에이전트의 자동화와 오케스트레이션을 지원한다.
네이버 ENGINEERING DAY 2026 발표. AI 에이전트가 엉뚱한 답변을 하는 근본 원인이 컨텍스트 부족임을 진단하고, 팀 데이터와 서빙 레이어 자산을 자동 수집해 에이전트에게 제공하는 Agentic Context Platform을 구축한 경험을 공유한다.
LY Corporation이 비즈니스 질문부터 데이터 분석, 인사이트 도출까지 전 과정을 자동화하는 생성형 AI 기반 분석 에이전트 시스템 PJ One Piece를 구축했다. 기존 평균 2주 걸리던 분석 리드타임을 약 10분으로 단축하고, 월 10건이던 분석 건수를 수백 건으로 늘리며 사용자층을 데이터 사이언티스트에서 부서 구성원 절반 이상으로 확대했다.
AI 에이전트가 OAuth 인증 없이 Cloudflare Worker를 즉시 배포할 수 있는 임시 계정(Temporary Accounts) 기능을 Cloudflare가 출시했다. 기존 Wrangler CLI는 로그인이 필요해 에이전트 자동화 루프를 깼지만, `wrangler deploy --temporary` 한 줄로 에이전트가 자율 배포→검증 사이클을 완성할 수 있게 됐다.
네이버 ENGINEERING DAY 2026 발표. 쇼핑 에이전트 답변 모델 개발에서 입력 스펙이 자주 바뀌는 문제를 해결하기 위해, 변경된 스펙만 입력하면 결함 탐지·프롬프트 최적화·SFT 학습 데이터 생성을 에이전트가 폐쇄 루프로 자동화하는 파이프라인을 설계한 경험을 다룬다.
네이버 ENGINEERING DAY 2026 발표. 매 세션마다 초기화되는 AI의 근본 한계를 넘어, 경험을 축적하고 스스로 성장하는 에이전트 프레임워크 GNOSIS의 설계 원칙과 구현 사례를 소개한다. 3-Loop 구조, Constitution, 5층 기억 아키텍처, 수학적 안전 보장까지 포함한 종합 프레임워크다.
LY Corporation 엔지니어가 AI 에이전트의 인가(Authorization) 문제를 OAuth 2.0 확장 표준인 ID-JAG(Identity Assertion JWT Authorization Grant)로 해결하는 핸즈온을 공개했다. IETF OAuth 워킹 그룹에서 논의 중인 이 초안은 기존 인증 중심 접근을 "이 에이전트가 이 사용자를 대신해 이 권한 범위 내에서 이 리소스에 접근하도록 인가됐는가?"로 재정의한다. Keycloak + Athenz + Ollama/Gemma 4 스택으로 로컬 쿠버네티스 환경을 구성해 실패 시나리오부터 정상 흐름까지 단계별로 체험할 수 있다.
AWS가 Amazon MWAA(관리형 Apache Airflow), Bedrock AgentCore Runtime, S3 Vectors, MCP를 결합해 클라우드 정책을 자동 수집·시맨틱 검색하고 역할별 AI 에이전트가 분석하는 거버넌스 아키텍처를 제안했다. IAM 정책, 보안 그룹, 스토리지 등 AWS 10개 카테고리와 타사 클라우드 정책을 MWAA DAG가 매일 자동으로 수집하고, Titan Embed v2로 벡터화해 자연어 쿼리로 조회할 수 있게 한다.
네이버 ENGINEERING DAY 2026 발표. 광고 SDK 환경에서 Sentry 같은 범용 에러 모니터링 SaaS를 연동하면 발생하는 구조적 한계를 분석하고, AI Agent를 활용해 전용 JavaScript 에러 모니터링 시스템 glog를 직접 구축한 경험과 그 가능성을 공유한다.
카카오 소셜추천엔진팀이 숏폼 추천 모델 운영 중 반복적으로 발생하는 지표 분석 작업을 AI 에이전트로 자동화한 Hadoop 기반 도입 사례다. 추천 시스템을 개발하다 보면 코딩 시간만큼이나 데이터를 들여다보는 시간이 길어지는데, "이번 주 CTR이 왜 떨어졌지?", "실험군 반응은 어땠지?", "배포 후 특정 사용자군에서 달라진 점은?" 같은 질문이 끊임없이 이어진다.
AI 상담원과 인간 상담원 전환 시 컨텍스트가 초기화되는 문제를 해결하기 위해 Twilio Agent Connect, Conversation Memory, Twilio Flex를 연결하는 Python 기반 구현 튜토리얼이다. 음성·SMS로 시작한 AI 상담 세션이 인간 상담원으로 전환될 때 Conversation Intelligence V3가 자동 요약을 생성해 Flex 대시보드에 컨텍스트를 전달하는 엔드투엔드 구조를 단계별로 설명한다.
인프랩 프론트엔드 팀이 20개 이상의 앱이 의존하는 Mantine 기반 디자인시스템을 v6에서 v8로 올리면서 AI 에이전트를 어떻게 활용했는지 다룬다. 단순 버전업이 아닌 스타일 기반 자체를 교체하는 작업이라 1차 시도가 실패했고, v6/v8 공존 격리 설계와 AI 에이전트 오케스트레이션으로 전사 규모 마이그레이션을 진행했다.
AI 에이전트를 규칙·도구·검증 체계 없이 운영하면 일관성 부족, 보안 리스크, 팀 확장의 어려움이 발생한다.
CLAUDE.md에 규칙을 많이 추가할수록 Claude가 이를 무시하는 "Context Rot" 현상이 발생한다. 긴 입력일수록 lost-in-the-middle 효과로 모델 성능이 저하된다.
코드 리뷰어가 "이거 실제로 돌아가?"를 검증하는 데 인지 부담이 쏠려 설계 품질 검토가 뒤로 밀린다.