pile·
최신
  1. AI / ML·AWS KoreaAWS Korea·

    GloZ의 Amazon OpenSearch Service를 기반으로 한 자연어 이력서 검색 시스템 구축 사례 — Part 1: 데이터 파이프라인과 인덱싱

    문제콘텐츠 번역가 10만 명을 자연어로 검색하려면 BM25 키워드와 벡터 의미 검색을 동시에 잘 다뤄야 한다. 기존 PostgreSQL 검색은 nDCG@10 0.90 목표에 미달.

    접근Amazon OpenSearch Service 로 이전하면서 Nori 한국어 형태소 분석기 + 다국어 임베딩 + Bedrock Cohere/Claude 로 데이터 정제 파이프라인 구축. 단일 쿼리에서 키워드와 벡터를 결합.

    결과nDCG@10 0.90 이상 달성. 표준 어휘 사전과 별칭 매핑으로 이력서 데이터 일관성도 확보.

    #embedding#opensearch#rag+2
  2. AI / ML·베스핀글로벌베스핀글로벌·

    AI Paradox (3) | 할루시네이션의 진짜 원인은 데이터 파이프라인에 있다

    문제AI 할루시네이션은 모델이 아니라 데이터 파이프라인 결함의 결과. PoC 에서 90% 정확도였던 모델이 프로덕션에서 실패하는 이유.

    접근3 레이어 구조: 입력단 AI 기반 자동 품질 감시 → 거버넌스 레이어로 출처·흐름·접근 추적 → 출력단 AI-on-AI 자동 검증. 검색 품질이 답변 정확도를 좌우하므로 맥락 기반 청킹·멀티모달 임베딩·하이브리드 검색·리랭킹 네 기법 적용.

    결과단일 플랫폼 도입이나 벡터 DB 구축만으론 부족함을 명확히 한 실전 검증 패턴. 도메인별 맥락을 잃지 않는 데이터 파이프라인이 진짜 해법.

    #data-pipeline#rag#governance+2
  3. AI / ML·AWS KoreaAWS Korea·

    AWS의 Claude Platform 소개: AWS 계정을 통한 Anthropic의 네이티브 Claude Platform 시작하기

    문제AWS 사용자가 Claude Platform 의 Messages API, Managed Agents, MCP, 코드 실행 등 모든 기능을 별도 자격증명/계약 없이 쓰고 싶다.

    접근Anthropic 의 네이티브 Claude Platform 을 AWS 계정으로 직접 인증·청구. IAM, Marketplace, CloudTrail 과 통합. 워크스페이스로 프로젝트·환경·팀 분리.

    결과환경변수 + API 호출만으로 Claude Code, Claude Cowork 등 다양한 클라이언트 연결. Cost Explorer 에서 AI 지출을 다른 AWS 서비스와 함께 모니터링. 17개 리전 제공.

    #claude#aws#mcp+2
  4. AI / ML·AWS KoreaAWS Korea·

    GS SHOP의 영상 기반 AI 상품 추천 플랫폼 구축기

    문제GS SHOP 의 영상 콘텐츠를 추천에 어떻게 활용할 것인가. PD 가 영상 검수에 1시간 소요.

    접근Bedrock 위 TwelveLabs Pegasus 로 영상 전체 이해 → Claude Sonnet 4 로 소구 포인트 추출(기능성·스타일·상황·실용성) → Cohere Embed Multilingual 로 벡터화 → OpenSearch 유사도 검색. 기존 추천을 교체하지 않고 위에 영상 신호를 얹는 Hybrid 방식.

    결과PD 검수 1시간→수초, 클릭 UV +21.7%, 총주문고객수 +57.5%, 전환율 +29.4%. ElastiCache 의도 점수 + MMR 재정렬로 필터 버블 방지.

    #recommendation#embedding#opensearch+2
  5. AI / ML·AWS KoreaAWS Korea·

    Agentic AI 기반 플랫폼 – Part3 : AgentCore Policy, Evaluation, Observability로 기업 운영 체계 구축하기

    문제엔터프라이즈 AI Agent 운영에 Tool 호출 권한·품질 평가·실시간 추적을 어떻게 일관성 있게 적용하는가.

    접근Bedrock AgentCore 가 세 서비스로 분리. Policy(Cedar 정책 언어 + Gateway 단 권한 결정), Evaluation(13개 빌트인 + LLM-as-Judge 온라인 평가), Observability(OpenTelemetry 분산 트레이싱 + CloudWatch GenAI 대시보드).

    결과Agent 코드와 무관한 보안 경계 + 프로덕션 품질 변화 지속 모니터링 + LLM 호출~Tool 실행 전 구간 시각화로 운영 체계 완성.

    #agent#observability#governance+2
  6. AI / ML·AWS KoreaAWS Korea·

    AI-DLC 를 팀 프로젝트에 적용하기: Subagent 와 Custom Skill 로 확장한 Armiq 사례

    문제AI 기반 개발 생명주기(AI-DLC)를 Brownfield(기존 코드 개선)와 Greenfield(신규 개발) 두 프로젝트에 동시에 적용해야 한다.

    접근Adaptive Workflow + Unit 추상화 + Main Agent 가 Subagent(역공학·코드 생성)에 위임. requirements-generator / git-merge / Unit별 Code Review 세 Custom Skill 로 확장.

    결과Brownfield AETL 성능 103~119% 향상, Greenfield ACMS 4주 안에 55개 API 완성.

    #code-review#claude-code#agent+2
  7. AI / ML·LINE EngineeringLINE Engineering·

    ODW #6: Git 자동화 관점에서 본 MCP와 에이전트 스킬의 장단점

    문제AI 에이전트로 Git 릴리스 자동화를 만들 때 MCP 서버와 에이전트 스킬 중 무엇이 더 적합한가.

    접근같은 Git 릴리스 워크플로를 MCP(skill-creator)와 스킬(git-release-mcp) 두 방식으로 각각 구현해 비교했다. 권한, 토큰 비용, 외부 시스템 연동 측면을 모두 점검.

    결과스킬은 절차 지식을 내재화해 권한 남용과 토큰 낭비를 줄이고, MCP는 외부 시스템 연결 유연성에 강하다. 결론은 MCP는 인프라 통합용, 스킬은 워크플로 자동화용으로 역할 분리하는 것이 이상적.

    #llm-agent#mcp#claude-skills+2
  8. AI / ML·당근당근·

    누구나 찾아볼 수 있는 중고거래 서버 LLM 릴리즈 노트 도입기

    문제팀원이 "이 기능 언제 나갔어요?"라고 물을 때마다 매번 git log를 정리하는 비효율. 기술 용어로 가득한 배포 내역이 비개발자에게는 의미 없다.

    접근GitHub Actions로 PR 정보를 Notion에 자동 기록한 뒤, 일일 CronJob으로 Notion 데이터를 Claude API에 보내 비개발자도 이해할 수 있는 형태로 요약한다. 프롬프트는 Prompt Studio에서 코드 외부로 관리.

    결과분류 체계 + 용어 변환 사전으로 기술 용어를 팀 언어로 자동 번역. 같은 데이터 자산이 주간 자동화, LLM 문맥, 다른 팀 도입 등으로 확산.

    #llm-app#release-notes#github-actions+2
  9. AI / ML·LINE EngineeringLINE Engineering·

    AI는 QA를 대체하지 않았다, 대신 확장했다

    문제QA(품질보증) 업무에 AI를 도입할 때 단순 도구로 쓰면 효과가 제한적이다. 운영 체계 자체를 어떻게 바꿔야 하는가.

    접근LINE Album QA가 AI를 "품질 운영 체계 자체"에 통합. 30개 이상의 스케줄링/웹훅 기반 자동화 워크플로를 운영하고, 테스트 케이스 90%를 AI 초안으로 생성하되 휴먼 인 더 루프 구조로 인간 검증을 필수화.

    결과QA가 반복 작업에서 해방돼 제품 맥락 이해와 리스크 판단 같은 고부가가치 업무에 집중. AI 단독 사용보다 인간 협업이 더 우수하다는 점을 블라인드 실험으로 검증했다.

    #llm-app#qa-automation#human-in-the-loop+2
  10. AI / ML·베스핀글로벌베스핀글로벌·

    “실험은 끝났다” Google Cloud Next 26이 선포한 AI 에이전트의 시대

    문제AI 에이전트가 파일럿을 넘어 전사 운영 단계로 진입. 기획·배포·관리·보안을 어떻게 통합할 것인가.

    접근Google Cloud Next 26 발표 4축. Gemini Enterprise Agent Platform(코딩 없이 생성·관리, 타사 모델 연동), TPU 8세대 듀얼 칩(학습 8t + 추론 8i 로 달러당 성능 80% 향상), Agentic Data Cloud(비즈니스 맥락 자동 추론), 3단계 자동 보안.

    결과보안·거버넌스 초기 설계, 데이터 전략을 에이전트 이해도 중심으로 재구성, 에이전트를 통합 시스템으로 접근하는 청사진 제시.

    #gemini#agent#tpu+2
  11. AI / ML·마이리얼트립마이리얼트립·

    Product Engineer: 하루 500건 분석 요청을 받아내는 데이터 에이전트, 일을 돕는 AI에서 일을 수행하는 AI로

    문제분석가가 하루 4~7건만 처리하던 반복적 데이터 분석 요청을 자동화하고 더 전략적 업무에 집중하도록 함.

    접근Claude API 기반 멀티 에이전트 아키텍처(Listener, Dispatcher, Parent Worker, Sub-agents) + Metric Registry + DBT YAML 메타데이터 + 4겹 안전망(Role, Gate, Rule, Hook) + 100+ eval 테스트.

    결과하루 500~600건 분석 요청 자동 처리, 분석가는 지표 설계·정책 수립·신규 에이전트 개발로 업무 전환.

    #claude-code#agent-engineering#data-agent+4
  12. AI / ML·마이리얼트립마이리얼트립·

    월 7만 5천 건 CS, 마이리얼트립 자회사 ‘AICX’가 풀어낸 자동화

    문제마이리얼트립이 월 7만 5천 건의 CS 인입을 처리하면서 인력 효율과 고객 만족도의 균형을 맞춰야 함.

    접근AI Agent(채팅 "AI 여행 메이트 마리", 전화 Agent)를 기존 상담 툴 위 레이어로 추가. 문의 유형 분석으로 자동화 영역(예약 확인, 정책 안내)과 인력 영역(환불, 클레임) 구분. 채널 통합 + 시트 자동화의 2축 운영.

    결과상담원 57명에서 절반 이상 감축, 채팅 봇 첫 응대 80% 중 절반 자체 종료, 전화 Agent 100% 첫 응대 / 57% 자체 해결. 챗봇 만족도 4.61 vs 상담원 4.63 동등 수준.

    #ai-agent#automation#customer-support+5
  13. AI / ML·LINE EngineeringLINE Engineering·

    ODW #5: 벡터 DB와 에이전트 스킬로 RAG 시스템 만들기

    문제대량의 개발 문서 검색에 시간이 많이 들고, 사내 전문가 상담도 비효율적이다.

    접근Swift Evolution 문서를 ChromaDB 벡터 DB로 구축한 뒤, 에이전트 스킬로 MCP 도구 사용을 간소화. 자연어 검색으로 코딩 에이전트가 자동 문서 참조.

    결과코드 생성/리뷰 프로세스가 개선됐고, 1,000명 이상이 참여한 전사 워크숍으로 실무 적용을 확산.

    #llm-agent#rag#mcp+2
  14. AI / ML·스캐터랩스캐터랩·

    유저와 함께 만드는 LLM — 제타에 Preference Optimization 도입하기

    문제엔터테인먼트 LLM 의 재미를 향상하기 위한 선호도 데이터 수집의 어려움.

    접근DPO(Direct Preference Optimization) 알고리즘과 사용자 재생성 신호 필터링으로 preference pair 구성.

    결과1차 사이클에서 주간 이용 시간 8.1% 상승, Week 1 리텐션 1.19%p 증가. 2차 사이클에서 추가 3.27% 이용 시간 증가.

    #llm#performance#preference-optimization+3
  15. AI / ML·베스핀글로벌베스핀글로벌·

    정확도 3%에서 98%로 상승? 데이터 정제보다 무서운 ‘데이터 고립’

    문제AI 도입 기업의 7% 만 데이터가 준비 상태. 정제만으론 부족하고 데이터 간 맥락이 빠지면 AI 가 추론을 못 한다.

    접근온톨로지(개체·속성·관계·규칙)로 데이터에 의미·구조 부여. SNOMED CT 같은 표준 온톨로지 적용 시 정확도 3% → 98%. 작게 시작·전사 참여·운영 중시 3원칙.

    결과Gartner 는 2030 까지 시맨틱 레이어가 핵심 인프라가 될 것으로 전망 (2025~2029 관련 지출 7배). 데이터 고립을 깨는 진짜 해법.

    #governance#ontology#semantic-layer+2