주간AI를 시작합니다. 앞으로 닷넷데브와 슬로그램 동시에 올릴 예정입니다.
주요 뉴스
DeepSeek, GPT-5에 필적하는 초강력 AI 모델 2종 무료 공개
중국 AI 스타트업 DeepSeek가 685억 파라미터 규모의 V3.2와 V3.2-Speciale 모델을 MIT 라이선스로 공개했습니다. OpenAI의 GPT-5, Google의 Gemini-3.0-Pro에 필적하는 성능을 주장하며, 오픈소스 모델이 프론티어 수준 성능을 달성할 수 있음을 입증했습니다.
Amazon, 며칠간 사람 도움 없이 코딩하는 Frontier AI Agent 공개
AWS re:Invent 2025에서 Kiro, AWS Security Agent, AWS DevOps Agent 3종의 프론티어 에이전트가 발표되었습니다. 기존 AI 코딩 도구와 달리 세션 간 지속적인 메모리를 유지하고, 여러 코드 저장소에서 동시 작업이 가능하며, 수일간 자율적으로 작동합니다.
Mistral 3, 노트북·드론·엣지 디바이스용 오픈 모델 제품군 출시
Mistral AI가 플래그십 Mistral Large 3와 엣지 컴퓨팅용 Ministral 3 모델을 Apache 2.0 라이선스로 공개했습니다. 더 큰 독점 시스템이 아닌 비즈니스 맞춤형 AI 배포의 최대 유연성을 제공하는 방향에 베팅합니다.
새로운 도구/서비스
Microsoft Fara-7B: 컴퓨터 사용을 위한 효율적인 에이전트 모델
Microsoft의 첫 번째 에이전트형 소형 언어 모델(SLM)로, 7B 파라미터만으로 컴퓨터 사용 에이전트 분야에서 최고 성능을 달성합니다. 마우스·키보드를 통해 웹페이지와 상호작용하며, 평균 16단계만으로 작업을 완료해 경쟁 모델의 41단계보다 훨씬 효율적입니다.
Microsoft Agent Framework의 “골든 트라이앵글”: AG-UI, DevUI & OpenTelemetry
에이전트 AI 개발의 3대 과제(블랙박스 실행, 상호작용 사일로, 성능 사각지대)를 해결하는 개발 스택을 소개합니다. DevUI로 시각적 디버깅, AG-UI로 즉시 사용 가능한 프론트엔드, OpenTelemetry로 분산 트레이싱과 비용 투명성을 제공합니다.
Azure AI Foundry Agent Service의 Computer Use 도구 프리뷰 발표
Azure AI Foundry에서 AI 에이전트가 실제 컴퓨터 화면과 상호작용할 수 있는 Computer Use 도구를 프리뷰로 공개했습니다. 텍스트 추론, 이미지 생성, 실제 컴퓨터 상호작용을 결합한 에이전트 구축이 가능해집니다.
xAI의 Grok 4, Grok 4.1 Fast 등 Grok 계열 LLM이 JetBrains IDE의 AI 채팅에 추가되었습니다. 개발자가 워크플로우에 맞는 모델을 더 유연하게 선택할 수 있게 되었습니다.
학습 자료
Anthropic의 Model Context Protocol이 1년을 맞았습니다. SSE에서 HTTP-Streamable로의 전환, OAuth 2.1 지원, 컨텍스트 윈도우 관리를 위한 도구 통합 등 실제 대규모 운영 경험에서 얻은 교훈과 2026년 전망을 공유합니다.
효율적인 컨텍스트 관리: LLM 에이전트 비용 50% 절감 방법
JetBrains Research가 AI 에이전트의 컨텍스트 관리 전략을 비교 분석했습니다. LLM 요약 방식보다 간단한 관찰 마스킹 방식이 비용 대비 효과가 높으며, 두 방식을 결합한 하이브리드 접근법으로 추가 7% 비용 절감이 가능합니다.
제로 트러스트 에이전트 아키텍처: AI 에이전트 보안 구축 가이드
Microsoft Foundry 기반 에이전트 보안 설계 가이드입니다. 도구 정책 적용, 프롬프트 실드를 통한 간접 주입 공격 방어, 해시된 지시문 태그 등 실무에 바로 적용할 수 있는 제로 트러스트 패턴을 상세히 설명합니다.
인사이트
Google Chrome 개발자 경험 책임자 Addy Osmani가 'Vibe Coding’과 진정한 AI 지원 엔지니어링의 차이를 분석합니다. 18명의 CTO 중 16명이 AI 생성 코드로 인한 프로덕션 재앙을 경험했으며, 프로토타이핑에는 유용하지만 프로덕션에는 엔지니어링 규율이 필수입니다.
클라우드 네이티브에서 AI 네이티브로: 어디로 가고 있는가
KubeCon + CloudNativeCon 패널이 AI 네이티브 시대의 핵심 관심사를 논의합니다. CNCF 신임 이사는 '추론(Inference)'이 핵심 관심사라고 밝혔으며, WebAssembly의 보안 샌드박싱, 옵저버빌리티의 데이터 폭증, 전력 문제 등 새로운 인프라 과제를 다룹니다.
AI 시대의 자기 파괴: Stack Overflow의 진화
Stack Overflow CEO가 GenAI 시대의 새로운 성공 지표를 제시합니다. 트래픽이 아닌 도달 범위, 신뢰, 귀속, 영향력이 중요해졌으며, 지식 서비스(KaaS), API 파트너십, 인간 검증 레이어가 새로운 비즈니스 모델입니다. AI Assist 출시로 전 세계 28만 5천명 이상이 활용 중입니다.
Transformers v5: AI 생태계를 움직이는 간단한 모델 정의
Hugging Face가 Transformers v5.0을 발표했습니다. 하루 300만 회 이상 설치되는 라이브러리가 PyTorch 단일 백엔드로 전환하고, 모듈화 설계로 기여 부담을 줄였습니다. vLLM, SGLang, llama.cpp, MLX 등과의 상호운용성을 핵심 테마로 삼습니다.
