취약점 발견 하네스 직접 구축하기
Cloudflare가 내부 보안 취약점 탐색에 멀티 에이전트 LLM 파이프라인을 적용한 경험을 공개한다. "취약점 발견 하네스(VDH)"와 "취약점 검증 시스템(VVS)"의 2단계 구조로 운영되며, 모델을 교체 가능한 구성 요소로 취급하는 모델-독립 아키텍처가 핵심 설계 원칙이다. 실제 운영에서 원본 20,799개 후보를 삼계층 필터링으로 7,245개 실행 가능 발견사항까지 정제했다.
최근 7일 가장 많이 읽힌 글과, 회사별로 어떤 주제를 많이 쓰는지 한눈에. 조회·클릭·읽음 데이터로 집계.
Cloudflare가 내부 보안 취약점 탐색에 멀티 에이전트 LLM 파이프라인을 적용한 경험을 공개한다. "취약점 발견 하네스(VDH)"와 "취약점 검증 시스템(VVS)"의 2단계 구조로 운영되며, 모델을 교체 가능한 구성 요소로 취급하는 모델-독립 아키텍처가 핵심 설계 원칙이다. 실제 운영에서 원본 20,799개 후보를 삼계층 필터링으로 7,245개 실행 가능 발견사항까지 정제했다.
컬리가 배송 도메인 지식을 LLM 에 주입하려다 마크다운 문서가 쌓이며 토큰 비용과 "lost in the middle"에 부딪혀, 검색 구조를 두 번 갈아엎은 과정을 다룬다. inverted index → 본문 임베딩 → 요약 임베딩+본문 FTS 분업으로 이어지며, 결국 "무엇을 모델에 맡기고 무엇을 도구·사람에 분담할지 선을 옮긴 작업"이라는 결론에 닿는다.
Cloudflare가 자체 Agents SDK를 개방형 런타임 플랫폼으로 전환해 외부 에이전트 프레임워크가 활용할 수 있도록 했다. Astro 팀이 만든 오픈소스 프레임워크 Flue가 첫 번째 채택자로 합류했다. 단순 SDK 제공을 넘어 다양한 프레임워크가 Cloudflare 인프라(영속 실행·SQLite 상태 저장·동적 코드 실행)를 공유하는 생태계 확장을 의미한다.
당근 중고거래 서버 팀이 "이 기능 언제 배포됐냐"는 반복 질문에 드는 커뮤니케이션 비용을 줄이려고, 배포 내역을 비개발자도 읽을 수 있는 릴리즈 노트로 자동 생성한 과정을 다룬다. 핵심 교훈은 두 가지다. LLM 을 붙이기 전에 정제된 데이터 자산을 먼저 쌓아야 하고, LLM 은 PR 을 요약은 해도 독자를 고려해 사내 용어를 번역하지는 않는다는 점이다.
토스가 2,800만 MAU의 유저 이용 패턴을 이해하기 위해 개발한 세그멘테이션 시스템 TUES(Toss User Engagement Segment)의 설계와 V1에서 V2로의 진화 과정을 다룬다. Hard Clustering에서 Soft Clustering으로 전환하고 서비스별 관여도 차원을 추가해 분석 정밀도를 높인 실전 사례다.
LY Corporation 엔지니어가 AI 에이전트의 인가(Authorization) 문제를 OAuth 2.0 확장 표준인 ID-JAG(Identity Assertion JWT Authorization Grant)로 해결하는 핸즈온을 공개했다. IETF OAuth 워킹 그룹에서 논의 중인 이 초안은 기존 인증 중심 접근을 "이 에이전트가 이 사용자를 대신해 이 권한 범위 내에서 이 리소스에 접근하도록 인가됐는가?"로 재정의한다. Keycloak + Athenz + Ollama/Gemma 4 스택으로 로컬 쿠버네티스 환경을 구성해 실패 시나리오부터 정상 흐름까지 단계별로 체험할 수 있다.
Amazon EKS 환경에서 무중단 배포(Rolling Update/Blue-Green)를 적용했음에도 간헐적으로 502 Bad Gateway·504 Gateway Timeout이 발생하는 근본 원인과 해결책을 다룬다. ALB·K8s·Istio·Argo Rollouts의 종료 시퀀스가 어긋나는 타이밍 문제가 핵심이며, terminationGracePeriodSeconds·preStop hook·ALB deregistration_delay 세 축을 정렬해 해결한다.
삼성 이커머스의 가격 제공 시스템이 시간당 크론 잡 기반 캐싱에서 AWS Lambda Response Streaming을 활용한 실시간 스트리밍 아키텍처로 전환한 과정을 다룬다. 기존 방식은 30개 이상 제품 변형 조합의 폭발과 1시간 동기화 지연으로 플래시 세일 중 오래된 가격이 노출되는 문제가 있었다. 신규 아키텍처는 P90 레이턴시를 4,500ms에서 50ms로 90배 단축하고 인프라를 100개 이상 인스턴스에서 Lambda 5~10개로 단순화했다.
AWS Korea 기술 블로그가 공개한 Deep Insight Chatbot은 "반나절에 만드는 CSV 분석 챗봇"과 "분석가가 매일 쓰는 생산성 도구"를 가르는 4가지 설계 결정을 다룬다. 데이터 보호, 속도, 신뢰성, 비용이라는 네 가지 요구사항을 중심으로 DuckDB 샌드박싱, 세션 기반 OLAP 엔진, SQL 투명성, Bedrock 프롬프트 캐싱을 결합해 운영 가능한 대화형 분석 도구를 만드는 방법을 설명한다.
LY Corporation이 레거시 프로젝트를 AI 중심으로 전환하는 4단계 AX(AI Transformation) 로드맵을 공개했다. 핵심 방법론은 SDD(Spec-Driven Development, 명세 주도 개발)로, 코드나 테스트를 먼저 작성하던 기존 방식 대신 요구 사항과 명세를 먼저 확정한 뒤 AI가 코드를 생성하는 흐름으로 전환한다. 완전 전환 시 기능 정의부터 테스트까지 2~3일이 걸리던 개발 사이클을 2~3시간 안에 완료하는 것이 목표다.
TVING 쇼츠 플레이어가 영상마다 별도 플레이어 객체를 생성해 저사양 단말에서 OOM과 하드웨어 디코더 자원 한계가 발생했다.
TVING 쇼츠 플레이어에서 초기 VST가 평균 740ms로 길고, 저사양 단말에서 OOM과 디코더 초기화 실패가 발생했다.