주말아침 - 주간AI #15

OpenAI의 GPT-5.4가 105만 토큰 컨텍스트로 Microsoft Foundry에 등장하고, Codex Security는 120만 커밋에서 14개 CVE를 찾아냈습니다. Google의 Gemini Embedding 2는 텍스트·이미지·비디오·오디오를 아우르는 최초의 네이티브 멀티모달 임베딩 모델이며, VS Code 1.111 Autopilot은 차단 질문까지 자율 판단하는 새 경지를 열었습니다. "SKILL.md가 MCP 서버보다 100배 효율적"이라는 2계층 아키텍처 논쟁이 뜨겁고, NYT는 70명 이상의 개발자 인터뷰로 “코더 이후의 코딩” 시대를 조명합니다. 12시간 LLM 파인튜닝 코스부터 Graph RAG vs Vector RAG, PlugMem의 에이전트 메모리 혁신까지 — 실전과 미래를 동시에 잡는 알찬 한 주입니다.

:fire: 주요 뉴스

GPT-5.4, Microsoft Foundry에서 사용 가능

OpenAI의 GPT-5.4가 Microsoft Foundry를 통해 공개되었습니다. 105만 토큰 컨텍스트 윈도우, 내장 에이전틱 워크플로우, 네이티브 컴퓨터 사용, Tool Search 기능을 제공하며, 심층 분석용 GPT-5.4 Pro 변형도 함께 출시됩니다. 가격은 입력 $2.50 / 출력 $15.00 (백만 토큰당)입니다.

Meta, AI 에이전트 전용 소셜 네트워크 Moltbook 인수

Meta가 AI 에이전트들이 서로 상호작용할 수 있는 Reddit 스타일의 소셜 네트워크 Moltbook을 인수했습니다. AI 에이전트 간 커뮤니케이션과 협업을 위한 전용 플랫폼으로, Meta의 AI 에이전트 생태계 전략의 핵심 행보로 평가됩니다.

Codex Security, 연구 프리뷰로 공개

OpenAI의 애플리케이션 보안 전문 AI 에이전트입니다. 위협 모델 구축, 취약점 검증, 수정안 제안까지 자동화하며, 120만 커밋을 스캔해 792개 치명적 발견사항과 14개 CVE를 식별했습니다. Enterprise, Business, Edu 플랜에 순차 롤아웃됩니다.

Nvidia, 오픈소스 AI 에이전트 플랫폼 출시 계획

Nvidia가 AI 에이전트 개발과 배포를 위한 오픈소스 플랫폼 출시를 준비하고 있습니다. 표준화된 AI 에이전트 인프라를 제공하여 개발자들이 보다 쉽게 에이전트 시스템을 구축할 수 있도록 하는 것이 목표입니다.

2026 MCP 로드맵 공개

Model Context Protocol의 2026년 로드맵이 발표되었습니다. Transport Evolution & Scalability, Agent Communication, Governance Maturation, Enterprise Readiness 4가지 우선순위 영역을 중심으로 Working Groups가 개발을 주도하며, SEP(Specification Enhancement Proposal)가 우선순위에 맞으면 신속 검토를 받습니다.

Adobe, 포토샵용 AI 어시스턴트 베타 공개

Adobe가 포토샵에 자연어 기반 AI 어시스턴트를 베타로 도입합니다. 웹과 모바일에서 자연어로 이미지를 편집할 수 있으며, AI 마크업 기능도 포함됩니다. Firefly에는 Generative Fill, Remove, Expand 기능이 추가됩니다.

:rocket: 새로운 도구/서비스

Replit Agent 4: 창의성을 위해 설계

Replit의 차세대 에이전트로 4대 핵심 축은 Design Freely, Move Faster, Ship Anything, Build Together입니다. 병렬 에이전트 실행, 무한 디자인 캔버스, 멀티유저 바이브 코딩, 작업 기반 워크플로우를 지원하며 웹/모바일 앱, 슬라이드, 애니메이션까지 빌드할 수 있습니다.

Microsoft Agent Framework for .NET v1.0.0-rc4 릴리스

버그 수정과 함께 Foundry 확장 샘플, ServiceLifetime DI 지원, 압축(compaction) 전략 및 파이프라인, AgentResponses의 FinishReason, FoundryMemory NuGet 패키지가 추가되었습니다.

Google Gemini Embedding 2 발표

최초의 네이티브 멀티모달 임베딩 모델입니다. 텍스트(8,192 토큰), 이미지(요청당 6개), 비디오(120초), 오디오, 문서(PDF 6페이지)를 지원합니다. MRL(Matryoshka Representation Learning)로 3072/1536/768 유연한 차원을 제공하며 최신 벤치마크에서 최고 성능을 기록했습니다.

Claude, 대화 중 인터랙티브 시각화 생성 기능 (베타)

Claude가 대화 맥락에서 인터랙티브 차트, 다이어그램, 시각화를 인라인으로 생성하는 베타 기능을 공개했습니다. Artifacts와 달리 임시적이며, 이해를 돕기 위한 대화 내 시각 보조 도구로 설계되었습니다.

Claude Code Review: 멀티 에이전트 PR 리뷰

코드 출력이 200% 증가하면서 리뷰가 병목이 되자, 멀티 에이전트 PR 리뷰 시스템을 도입했습니다. PR의 54%에서 실질적 코멘트를 제공(이전 16%), 대형 PR은 84%에서 발견사항이 있으며 평균 7.5개 이슈를 찾아냅니다. 오탐률 1% 미만, 리뷰당 비용 $15-25.

Tracy: Kotlin AI 관찰성 오픈소스 라이브러리

JetBrains가 공개한 Kotlin용 AI 관찰성 라이브러리입니다. withSpan API, LLM 클라이언트 원라인 계측, @Trace 어노테이션으로 도구 호출을 추적합니다. Langfuse, W&B Weave, OpenTelemetry 백엔드를 지원합니다.

VS Code 1.111 Autopilot 프리뷰 실전 리뷰

VS Code 1.111의 3가지 권한 레벨(Default Approvals, Bypass Approvals, Autopilot)을 실전 테스트한 결과입니다. Autopilot은 단순 승인 생략을 넘어 차단 질문에도 자율적으로 판단하고 작업을 계속 진행합니다. 테스트에서 Bypass가 멈춘 상황에서도 Autopilot은 스스로 최선의 결정을 내리고 완료까지 도달했습니다.

:books: 학습 자료

Python, Docker, Claude Code로 MCP 서버 구축하기

FastMCP Python 서버 구축, Docker 컨테이너화, Claude Code 연동까지 전체 과정을 다루는 튜토리얼입니다. CVE와 프롬프트 인젝션 등 보안 이슈도 함께 다룹니다. 약 100줄의 Python 코드와 6줄의 Dockerfile로 완성됩니다.

12시간 만에 LLM 파인튜닝 배우기

PEFT(LoRA/QLoRA), RLHF/DPO 정렬, Unsloth/Axolotl/Llama Factory 도구 활용, Vision Transformers, 멀티모달 아키텍처를 포괄하는 12시간 집중 코스입니다.

프롬프트 인젝션에 저항하는 에이전트 설계

프롬프트 인젝션을 소셜 엔지니어링 관점에서 분석합니다. Safe Url 완화 기법으로 제3자에게 정보가 전송되는 것을 탐지하며, Source-sink 분석 프레임워크와 실제 공격 사례를 통해 방어 전략을 제시합니다.

Microsoft Agent Framework, Foundry, MCP, Aspire로 실전 예제 구축하기

Interview Coach 샘플 앱을 통해 5개 전문 에이전트의 핸드오프 패턴, MCP 도구 서버(MarkItDown + InterviewData), Aspire 오케스트레이션, Blazor UI 구성을 학습합니다. azd up 한 줄로 배포 가능합니다.

Graph RAG vs Vector RAG 비교 분석

Graph RAG(지식 그래프 기반 관계 탐색, 멀티홉 쿼리)와 Vector RAG(임베딩 기반 유사도 검색, 비정형 텍스트) 두 접근법을 심층 비교합니다. 결론적으로 두 방식을 결합한 하이브리드 접근이 미래 방향입니다.

PlugMem: AI 에이전트를 위한 메모리 재설계

Microsoft Research의 PlugMem은 원시 에이전트 상호작용을 구조화된 지식(사실 + 재사용 가능 스킬)으로 변환합니다. 지식 그래프 메모리 구조로 태스크에 무관하게 작동하며, 기존 태스크 특화 방식 대비 더 적은 토큰으로 우수한 성능을 달성합니다.

:light_bulb: 인사이트

MCP 서버 대신 Markdown 파일로 AI 에이전트 운영하기

지식 문제(Skills/Markdown)와 실행 문제(MCP)의 명확한 구분을 제안합니다. GitHub MCP 서버가 23,000~50,000 토큰을 소비하는 반면 SKILL.md는 200~500 토큰으로 같은 워크플로우 지식을 전달합니다. VC Brad Feld의 CompanyOS는 12개 Markdown 파일과 8개 MCP 서버로 회사를 운영하며, Microsoft .NET Skills Executor까지 2계층 모델로 수렴하는 업계 흐름을 보여줍니다.

“텍스트로서의 AI” 시대는 끝났다 — 실행이 새로운 인터페이스

GitHub Copilot SDK를 통해 에이전틱 실행을 애플리케이션에 직접 임베딩하는 3가지 패턴을 제시합니다. 멀티스텝 작업 위임, MCP 기반 구조화된 런타임 컨텍스트, IDE 외부에서의 실행. 고정 워크플로우가 아닌 의도(intent)를 전달하고 에이전트가 적응하는 아키텍처로의 전환을 강조합니다.

AI가 라이브러리를 쓸모없게 만들고 있다

ORM, CSS 프레임워크 등 범용 라이브러리의 쇠퇴를 예측하는 핫 테이크입니다. AI가 필요한 코드를 직접 생성하면서 “하나로 모두 맞추는” 접근이 무의미해지고, MCP 래핑도 이미 구식이 되어가며 Skill 기반 접근이 부상하고 있습니다. 흥미롭게도 블로그 포스트가 리포지토리보다 AI 에이전트에게 더 효과적인 학습 자료라고 전합니다.

코더 이후의 코딩: 우리가 아는 컴퓨터 프로그래밍의 끝

NYT Magazine이 Google, Amazon, Microsoft, Apple 등 70명 이상의 개발자를 인터뷰한 대형 기사에 대한 Simon Willison의 코멘트입니다. "프로그래머는 AI 사용이 쉬운 편 — 코드 테스트로 환각을 검증할 수 있다"는 Willison의 인용이 실렸으며, Jevons 역설을 통한 수요 증가 가능성과 함께 AI에 대한 개발자들의 낙관적 태도를 전합니다.

소프트 포크: 훈련 없이 전문화된 AI를 만드는 에이전트 스킬

Agent Skills를 오픈소스의 "소프트 포크"에 비유합니다. SKILL.md 포맷, Progressive Disclosure, 실행 컨텍스트 샌드박싱 메커니즘을 설명합니다. SkillsBench 벤치마크에서 평균 13.2%p 성능 향상을 보였고, 컴팩트 스킬이 종합 스킬보다 4배 효과적이며, Claude Haiku+스킬 조합이 Claude Opus 단독보다 높은 성과를 기록했습니다.

AI가 오픈소스를 죽일 것인가?

마이크로 오픈소스(유틸리티 패키지)는 AI가 즉석에서 코드를 생성하면서 쇠퇴할 전망이지만, Django, Postgres 같은 주요 프레임워크는 안전합니다. AI 에이전트도 uv pip install로 검증된 빌딩 블록을 사용하는 것을 선호하기 때문입니다. 스펙 주도 개발과 소규모 리뷰 가능한 단위 작업이 핵심 워크플로우로 권장됩니다.