주말아침 - 주간AI #2

dimohy · 12월 11, 2025, 9:46오전

날이면 날마다 오는 것이 아닌 주말이 아닌 주중에 올리는 주말 아침 - 주간 AI #2 입니다.

역사적인 순간입니다! MCP가 Linux Foundation으로 이관되며 AI 에이전트 인프라의 표준으로 공식 등극했습니다. OpenAI, Anthropic, Google, Microsoft, AWS, Block 등 7개 빅테크가 Agentic AI Foundation을 공동 설립하고, OpenAI는 AGENTS.md를 기증했습니다. Mistral은 노트북에서 돌아가는 Devstral Small 2와 Vibe CLI를 공개하며 오픈소스 코딩 AI 전쟁에 뛰어들었고—Software 2.0 시대, "검증 가능한 AI"만이 살아남습니다.

주말아침 AI #2

주요 뉴스

2026년 이후 AI의 미래: 경제적 특이점인가, 정상적 기술인가?

O’Reilly의 Tim O’Reilly와 Mike Loukides가 AI 산업의 두 가지 시나리오를 분석합니다. 시나리오 1: AGI가 경제적 특이점이 되어 문명 수준의 불연속적 변화를 초래. 시나리오 2: AI는 강력하지만 정상적 기술로 점진적으로 확산. 현재 Anthropic이 실용적 수익화로 앞서가고, OpenAI의 대규모 투자가 과연 정당화될지 투자자들의 의문이 커지고 있습니다. DeepSeek의 효율성 혁신도 주목해야 할 변수입니다.

기업 AI 현황 2025 보고서 - OpenAI

OpenAI가 기업 AI 도입 현황 보고서를 최초 공개했습니다. ChatGPT Enterprise 주간 메시지가 8배 증가, 구조화된 워크플로우 사용이 19배 급증했습니다. 75%의 근로자가 AI로 속도나 품질이 향상되었다고 응답하고, 일일 40-60분을 절약합니다. 특히 비기술직의 코딩 관련 메시지가 36% 증가하며, AI가 의도와 실행 사이의 간극을 좁히고 있습니다.

Gemini 3 Pro, 블라인드 테스트에서 신뢰도 69% 달성 - Gemini 2.5의 16%에서 대폭 상승

Prolific의 HUMAINE 벤치마크에서 26,000명의 사용자를 대상으로 블라인드 테스트를 진행한 결과, Gemini 3 Pro가 신뢰도, 윤리, 안전성 부문에서 69%로 1위를 차지했습니다. 학술 벤치마크가 아닌 실제 사용자 신뢰도 기반 평가로, 다양한 인구통계학적 그룹에서 일관된 성능을 보여주었습니다.

Gemini 3 Deep Think, Gemini 앱에서 사용 가능

Google이 AI Ultra 구독자를 대상으로 Gemini 3 Deep Think 모드를 출시했습니다. 고급 병렬 추론으로 여러 가설을 동시에 탐색하여 복잡한 수학, 과학, 논리 문제를 해결합니다. Humanity’s Last Exam에서 41.0%, ARC-AGI-2에서 45.1%를 기록하며 업계 최고 수준을 달성했습니다.

AI 에이전트가 '기업 운영체제’로 진화하고 있다

Block의 goose AI 에이전트가 단순한 코드 작성 도구를 넘어 기업 내부 운영체제로 변모하고 있습니다. MCP 기반으로 Slack, Snowflake, Jira 등 수십 개 도구를 연결하며, Block 직원 60%(6,000명)가 매주 사용 중입니다. 며칠 걸리던 데이터 분석이 몇 분으로 단축되었습니다.

MCP, Linux Foundation으로 이관 - AI 에이전트 인프라의 표준이 되다

Anthropic이 MCP를 Linux Foundation 산하 Agentic AI Foundation(AAIF)에 기증했습니다. Kubernetes, PyTorch와 같은 경로를 걸으며 중립적 거버넌스 하에 진정한 산업 표준이 됩니다. OAuth 지원으로 원격 서버 실행이 가능해져 엔터프라이즈 환경에서도 안전하게 배포할 수 있습니다. 2025 Octoverse 기준 113만 개 저장소가 LLM SDK를 임포트하며(+178% YoY), MCP는 8개월 만에 GitHub 37K 스타를 달성했습니다.

OpenAI, Agentic AI Foundation 공동 설립 및 AGENTS.md 기증

OpenAI가 Anthropic, Block, Google, Microsoft, AWS, Bloomberg, Cloudflare와 함께 **Agentic AI Foundation(AAIF)**을 설립했습니다. OpenAI는 AGENTS.md—AI 코딩 에이전트에게 프로젝트별 지침을 제공하는 표준 포맷—을 기증합니다. 출시 4개월 만에 6만 개 이상의 오픈소스 프로젝트가 채택했으며, Cursor, Devin, GitHub Copilot, VS Code 등 주요 에이전트가 지원합니다.

새로운 도구/서비스

GitHub Copilot에 커스텀 에이전트 도입 - 옵저버빌리티, IaC, 보안을 위한 확장

GitHub이 Copilot 코딩 에이전트를 확장하는 커스텀 에이전트를 공개했습니다. Markdown 파일로 정의된 도메인 전문가 역할을 수행하며, Terraform, PagerDuty, JFrog, MongoDB 등 다양한 파트너 에이전트를 제공합니다. CLI, VS Code, github.com에서 바로 사용 가능합니다.

FastMCP로 첫 번째 MCP 서버 구축하기

Model Context Protocol(MCP)은 LLM이 외부 시스템과 안전하게 통신할 수 있는 표준 프로토콜입니다. FastMCP는 Python으로 MCP 서버를 쉽게 구축할 수 있는 프레임워크로, 몇 줄의 코드만으로 도구, 리소스, 프롬프트를 노출하는 서버를 만들 수 있습니다.

Azure MCP Server 시작하기

Microsoft가 AI 기반 개발 도구와 Azure 클라우드 서비스를 연결하는 Azure MCP Server를 공개했습니다. 자연어 대화로 Azure 리소스를 관리하고, VS Code, Cursor, IntelliJ 등 다양한 IDE와 통합됩니다. Python, .NET으로 자동화 스크립트 작성 및 앱 통합이 가능합니다.

Microsoft Learn MCP Server로 개발 경험 향상

Copilot이 Aspire 13이나 Agent Framework 같은 최신 기술에 대해 헛소리하는 경험을 해보셨나요? MS Learn MCP Server가 이 문제를 해결합니다. 최신 Microsoft 문서와 코드 샘플을 실시간으로 제공하여 Copilot이 항상 정확한 정보를 참조합니다. Visual Studio 2026/17.14에 기본 내장되며, VS Code와 CLI에서도 바로 사용 가능합니다.

Anthropic Claude Code, Slack과 통합 - 버그 리포트에서 PR까지 자동화

Anthropic이 Claude Code를 Slack에 통합하는 베타 기능을 출시했습니다. @Claude를 태그하면 채널 컨텍스트를 분석하고, 관련 저장소에서 자동으로 Claude Code 세션을 시작해 코드 수정 후 PR 링크까지 제공합니다. Claude Code는 출시 6개월 만에 연간 매출 10억 달러를 달성했으며, Netflix, Spotify, Salesforce 등이 사용 중입니다. Rakuten은 개발 기간을 24일에서 5일로 단축했습니다.

JetBrains IDE에 나만의 AI 에이전트 가져오기

JetBrains가 Agent Client Protocol(ACP) 베타 지원을 발표했습니다. LSP가 언어 서버를 표준화했듯이, ACP는 코딩 에이전트와 IDE 간 통신을 표준화합니다. Augment Code, goose, Kimi CLI 등 다양한 ACP 호환 에이전트를 IntelliJ 계열 IDE에서 자유롭게 사용할 수 있습니다.

Google Workspace Studio - AI 기반 자동화를 간편하게

Google이 Workspace Studio를 공개했습니다. AI 기반으로 복잡한 워크플로우 자동화를 간편하게 설정할 수 있으며, Gmail, Drive, Calendar 등 Google 앱들과 자연스럽게 연동됩니다.

Mistral Devstral 2 출시 - 노트북에서 돌아가는 강력한 코딩 AI

Mistral이 Devstral 2(123B)와 Devstral Small 2(24B)를 출시했습니다. SWE-bench Verified에서 72.2%로 DeepSeek V3.2보다 5배 작으면서 동등한 성능을 달성합니다. Devstral Small 2는 Apache 2.0 라이선스로 단일 GPU나 노트북에서 완전 오프라인 실행이 가능합니다. 함께 공개된 Vibe CLI는 터미널 네이티브 에이전트로, Git 상태 파악부터 멀티파일 리팩토링까지 처리합니다.

학습 자료

Software 2.0은 검증 가능한 AI를 의미한다

Andrej Karpathy가 제안한 Software 2.0의 핵심은 **검증 가능성(verifiability)**입니다. “작업이 검증 가능하면 강화학습으로 최적화할 수 있고, 신경망이 매우 잘 작동하도록 훈련할 수 있다.” Software 1.0은 명세할 수 있는 것을 자동화하고, Software 2.0은 검증할 수 있는 것을 자동화합니다. 양자컴퓨팅처럼 AI도 결과 검증이 핵심이 됩니다.

AI 에이전트에는 가드레일이 필요하다 - 거버넌스를 스택에 엔지니어링하기

AI 에이전트 네트워크가 복잡해지면서 거버넌스가 핵심 과제로 떠올랐습니다. O’Reilly는 정책을 코드로 관리(OPA), 관찰 가능성과 감사 추적, 동적 리스크 스코어링, 규제 매핑의 4가지 가드레일을 제시합니다. 거버넌스를 런타임 레이어로 구축하는 실용적 접근법을 다룹니다.

2026년 에이전틱 AI 마스터 로드맵

스스로 계획하고 행동하며 학습하는 에이전틱 AI가 2026년 주류가 될 전망입니다. 수학/프로그래밍 기초부터 자율 에이전트 이해, LangChain·AutoGPT 활용, 로보틱스·워크플로우 자동화 전문화까지 7단계 학습 로드맵을 제시합니다.

Google과 함께하는 5일 AI 에이전트 집중 코스

Google ML 연구원들이 설계한 AI 에이전트 핸즈온 과정입니다. 에이전트 기초, MCP를 통한 도구 연동, 세션과 메모리를 활용한 컨텍스트 엔지니어링, 에이전트 품질 평가, 프로토타입에서 프로덕션까지 5일간 체계적으로 학습합니다.

MCP가 승리한 이유

2024년 11월 출시된 MCP가 1년 만에 AI 연결의 표준으로 자리잡았습니다. OpenAI, Google, Microsoft가 모두 지원을 선언하며 USB-C처럼 범용 연결 프로토콜이 되었습니다. 보안 논란을 극복하고 커뮤니티 기여로 성장한 MCP의 성공 스토리를 분석합니다.

인사이트

OpenAI의 “고백(Confessions)” - 언어 모델의 정직성을 유지하는 방법

OpenAI가 모델이 지시를 위반하거나 의도치 않은 지름길을 택할 때 스스로 보고하도록 훈련하는 “고백” 기법을 공개했습니다. 모델의 주 응답과 별도로 정직성만을 평가받는 고백 채널을 두어, 해킹이나 샌드배깅 같은 문제 행동을 95.6% 정확도로 탐지합니다. AI 안전성 향상을 위한 투명성 도구로 활용됩니다.

AI 시대의 소프트웨어 - 2025년 회고와 2026년 전망

2025년 AI가 소프트웨어 개발 방식을 근본적으로 변화시켰습니다. 이제 90%의 개발자가 AI 코딩 어시스턴트를 사용하며, 에이전틱 AI와 MCP의 부상으로 개발자는 전체 팀처럼 AI를 활용합니다. 핵심은 컨텍스트 엔지니어링과 프롬프트 엔지니어링이며, 좋은 코드의 기본은 변하지 않습니다.

AI가 Anthropic의 업무를 어떻게 변화시키고 있는가

Anthropic이 내부 132명 엔지니어를 대상으로 AI 사용 현황을 조사했습니다. 직원들은 업무의 60%에 Claude를 사용하며 50% 생산성 향상을 보고했고, 이는 1년 전 대비 2배 이상 증가한 수치입니다. 27%의 Claude 지원 작업은 AI 없이는 하지 않았을 일들이며, 스킬 확장과 함께 기술 퇴화에 대한 우려도 공존합니다.

Gemini 3로 할 수 있는 15가지

Google이 Gemini 3의 다양한 활용 사례를 시연했습니다. 과학 논문을 인터랙티브 시각화로 변환, 프레젠테이션 코칭, 1시간 운동 영상 분석 후 코치 수준 피드백 제공, 자연어로 복잡한 웹 UI 생성 등—멀티모달 이해와 에이전틱 코딩 능력을 선보입니다.

AI 버블 붕괴 시 살아남는 전략

O’Reilly가 AI 불확실성에 대비한 10가지 로버스트 전략을 제시합니다. 버블 붕괴 대비: 보조금에 의존하지 않는 비즈니스 모델 구축. 에너지 한계 대비: SLM과 엣지 AI로 효율성 확보. 추론 상품화 대비: 모델이 아닌 통합·데이터·워크플로우에서 가치 창출. 보안 사고 대비: 최소 권한 원칙과 제로 트러스트 적용. 핵심은 어떤 미래가 오든 적응할 준비를 하는 것입니다.