마이크로소프트 빌드 2026, 어떤 기술‧제품 나왔나

마이크로소프트가 지난 6월 2일 미국 샌프란시스코에서 개최한 자체 개발자 행사인 마이크로소프트 빌드 2026(Microsoft Build 2026)를 통해 신제품과 신기술을 쏟아냈다.

마이크로소프트는 이 자리에서상시 자율형 AI 에이전트인 스카우트(Scout)를 공개하며 AI 에이전트 시대 전환을 선언했다. 스카우트는 마이크로소프트 365에 통합해 이메일·일정·문서 작업을 백그라운드에서 지속 수행하는 오토파일럿 개념을 제시했다. 이와 함께 추론 모델 MAI-Thinking-1을 포함한 자체 AI 모델 7종을 발표하고, AI 에이전트 전용 플랫폼 프로젝트 솔라라(Project Solara)와 개발자용 PC인 서피스 RTX 스파크 데브 박스를 공개했다. 또 AI 에이전트 보안·통제 기술인 MXC, ASSERT, ACS를 선보였으며 차세대 양자칩 마요라나 2(Majorana 2)와 연구개발 플랫폼 마이크로소프트 디스커버리를 발표해 AI·에이전트·양자컴퓨팅 중심 미래 전략을 제시했다.

◇ 사용자 대신해 업무 지속 수행…상시 자율형 AI 에이전트 공개=하나씩 살펴보면 마이크로소프트는 먼저 오픈클로(OpenClaw) 기반 상시 가동형 AI 에이전트인 스카우트(Scout)를 발표했다. 스카우트는 사용자가 매번 지시를 내리지 않아도 백그라운드에서 작업을 진행하는 오토파일럿(Autopilot)이라는 새로운 카테고리 첫 번째 에이전트로 자리매김하며 마이크로소프트 365에 통합된다.

오토파일럿은 마이크로소프트가 새롭게 제안하는 카테고리로 사용자로부터 매번 지시를 받는 게 아니라 백그라운드에서 지속적으로 동작하며 사용자와 조직이 설정한 권한 및 정책 범위 내에서 작업을 대행하는 에이전트를 가리킨다. 기존 AI 어시스턴트가 질문 답변이나 단발성 작업 지원에 집중했던 것과 달리 스카우트는 사용자 우선순위를 파악하고 업무 흐름을 지속적으로 앞으로 진행시키는 걸 목표로 한다.

이번에 발표된 스카우트는 마이크로소프트 365 각 앱에 통합되며 윈도 11 이상 및 맥OS 12 몬터레이(Monterey) 이상에서 이용할 수 있다. 채팅, 이메일, 캘린더, 연락처 등 일상 업무 관련 데이터를 다룰 수 있으며 사용자는 팀즈(Teams)를 통해 스카우트와 상호작용한다. 또 데스크톱 앱을 통해 브라우저, 로컬 리소스, MCP 서버로도 처리 범위를 확장할 수 있다.

스카우트 핵심 용도는 일상 업무에서 발생하는 조율 작업 자동화다. 마이크로소프트는 그 예로 시차를 넘나드는 회의 일정 조율, 중요 회의 알림, 회의 준비에 필요한 자료 생성, 향후 산출물 파악, 캘린더상 작업 시간 확보, 정체된 의사결정 감지 등을 들고 있다.

자율 실행 메커니즘으로는 15~120분 간격으로 백그라운드에서 확인을 수행하는 하트비트(Heartbeat)와 일정 또는 조건에 따라 독립적으로 태스크를 실행하는 오토메이션즈(Automations)가 마련되어 있다. 아울러 워드, 엑셀, 파워포인트 문서 작성·편집, 루프 문서의 브라우저 자동 편집, HTML 대시보드 및 도표를 만드는 웹 아티팩츠 빌더(Web Artifacts Builder) 등 내장 스킬에 더해 SKILL.md를 배치해 자체 스킬을 추가할 수도 있다.

데스크톱 앱으로서의 스카우트는 로컬 파일 생성, 편집, 검색에도 대응한다. 워드, 엑셀, 파워포인트, 코드 파일 등을 다룰 수 있을 뿐 아니라 셸 명령 실행, 빌드, 테스트, 스크립트 처리도 가능하며 브라우저 조작에는 플레이라이트(Playwright)를 활용한다.

마이크로소프트 365와의 연동에서는 이메일, 캘린더, 팀즈 메시지, 원드라이브 파일, 회의 정보를 다룰 수 있다. 예를 들어 작업 중인 코드를 편집해 빌드를 실행하고 그 결과를 이메일로 보낸 뒤 팔로업 회의까지 설정하는 일련의 작업을 한 대화 안에서 진행할 수 있다.

스카우트는 백그라운드에서도 동작하며 사용자가 정의한 일정이나 트리거에 기반해 태스크를 실행할 수 있다. 또 복잡한 작업에서는 조사나 코드 리뷰 등에 특화된 서브 에이전트를 병렬로 구동해 결과를 취합해 보고하는 기능도 갖추고 있다.

스카우트는 오픈클로 오픈소스 기술을 기반으로 하며 마이크로소프트는 오픈클로 측에도 기업용 보안 확인 기능을 추가해 나갈 방침이다. 이를 통해 오픈클로를 사용하는 기업은 이 에이전트는 사내 규칙에 맞게 설정되어 있는가, 허가되지 않은 데이터나 기능에 접근할 수 없는 상태인가를 확인하고 그 결과를 감사용 기록으로 남길 수 있게 된다.

스카우트의 문맥 이해에는 워크 IQ(Work IQ)가 활용된다. 워크 IQ는 사용자가 어떻게 일하고 무엇을 중시하며 다음에 무엇을 진행해야 하는지를 학습하는 구조로 스카우트는 시간이 지날수록 사용자 우선순위에 더 부합하는 지원을 제공할 수 있게 된다.

기업 활용을 전제로 한 제어도 중시된다. 스카우트 각 에이전트는 공유 익명 서비스 계정이 아닌 관리된 엔트라 ID(Entra ID) 하에서 동작하며 어떤 주체가 작업을 수행했는지 조직 디렉터리상에서 추적할 수 있다. 자격증명은 태스크 범위로 한정되며 로그 및 진단 정보에서는 은폐된다. 또 스카우트가 접근할 수 있는 건 승인된 리소스와 대상에 한정되며 민감도가 높은 작업에서는 사람의 승인을 요구할 수 있다. 마이크로소프트 퍼뷰(Microsoft Purview) 민감도 레이블과 데이터 손실 방지 정책도 전송 및 쓰기 전에 적용된다.

마이크로소프트에 따르면 사내에서는 이미 초기 스카우트 데스크톱 체험이 활용되고 있으며 그 경험을 통해 상시 가동형 에이전트가 실제 업무에서 어떻게 조율 작업을 담당하고 리스크를 조기에 부상시키며 지속적으로 업무를 진행하는지를 검증하고 있다. 스카우트는 현재 일반 제공되지 않으며 일부 고객을 대상으로 한 프라이빗 프리뷰와 프런티어(Frontier) 조직을 대상으로 공개 범위를 확대하는 단계다. 이용을 위해서는 프런티어 등록, 인튠(Intune) 정책 구성, 옵트인 증명이 필요하며 깃허브 코파일럿 라이선스 보유 사용자라면 체험판을 다운로드해 설치할 수 있다. 또 워크 IQ API는 2026년 6월 16일 일반 제공 개시 예정이다.

한편 마이크로소프트는 스카우트 자체와는 별개로 윈도 상에서 에이전트 동작 범위를 제한하는 MXC(Microsoft Execution Containers)도 발표했다. MXC는 윈도우와 WSL 상에서 에이전트의 실행 범위를 정책으로 제한하는 구조로 오픈클로도 윈도우 상에서 MXC를 활용해 노드와 게이트웨이를 안전하게 동작시킨다. 마이크로소프트는 OS, ID 관리, 정책 제어, 평가 기반을 결합해 AI 에이전트를 기업 환경에서 운용할 수 있도록 하는 방침을 제시하고 있다.

나아가 마이크로소프트는 AI 에이전트를 안전하게 평가·제어하기 위한 개발자용 기반으로 조직의 정책 및 요건으로부터 에이전트 평가를 만드는 오픈소스 프레임워크인 어서트(ASSERT)와 에이전트 단계별 안전 제어를 두는 ACS(Agent Control Specification)을 발표했다. 스카우트와 같은 자율형 에이전트를 실험 단계에서 본격 운용으로 이전하기 위한 신뢰성 확보가 핵심 주제가 되고 있다.

아울러 에이전트가 외부 정보를 다루기 위한 기반으로 웹 IQ(Web IQ)도 발표됐다. 웹 IQ는 인간을 위한 검색 결과가 아닌 AI 에이전트가 추론에 활용할 관련성 높고 신뢰할 수 있는 최신 정보를 저지연·토큰 효율적으로 제공하기 위한 시스템으로 마이크로소프트는 MCP 네이티브이자 모델 비의존적인 중립 플랫폼이라고 설명하고 있다. 관련 내용은 이곳에서 확인할 수 있다.

◇ 윈도에서 리눅스·유닉스 명령어를…=마이크로소프트는 또 유닉스(UNIX) 스타일 명령줄 유틸리티 세트인 코어유틸스 포 윈도(Coreutils for Windows)를 공개했다. 코어유틸스 포 윈도를 설치하면 CMD나 파워셸(PowerShell)에서 grep 등 명령어를 사용할 수 있게 된다.

코어유틸스 포 윈도는 GNU 코어 유틸리티(GNU core utilities, Coreutils)를 러스트(Rust)로 재구현한 uutils/coreutils와 uutils/grep, uutils/findutils를 윈도 전용 단일 패키지로 묶은 것.

코어유틸스 포 윈도를 설치하려면 명령 프롬프트나 파워셸에서 아래 명령어를 실행하면 된다. 깃허브 릴리스 페이지에서 EXE 파일을 다운로드하는 것도 가능하다. 파워셸은 버전 7.4 이상에서만 지원된다.

코어유틸스 포 윈도에 포함된 명령어 중에는 명령 프롬프트나 파워셸 기존 명령어와 중복되는 것도 있다. 예를 들어 파일 내용을 표시하는 cat이나 파일을 복사하는 cp는 파워셸 기존 명령어와 충돌한다. 또 dir이나 more 같은 DOS 명령어와 충돌하는 명령어는 코어유틸스 포 윈도에 포함되지 않는다.

코어유틸스 포 윈도는 현재 프리뷰 버전으로 제공되고 있다. 관련 내용은 이곳에서 확인할 수 있다.

◇ 클로드 소넷급 자체 초대형 추론 AI 모델 공개=마이크로소프트는 또 자체 개발한 추론 모델 MAI-Thinking-1과 소형 코딩 모델 MAI-Code-1-Flash를 포함한 독자 개발 AI 모델 7종을 6월 2일 발표했다. 발표된 모델 중 MAI-Thinking-1은 인간 평가에서 앤트로픽 클로드 소넷 4.6(Claude Sonnet 4.6)을 상회했다고 강조됐다.

마이크로소프트가 발표한 AI 모델은 아래 7종. MAI-Image-2.5는 5월 26일 발표됐던 모델이 재차 공개된 것이다. MAI-Thinking-1은 총 파라미터 수 1조, 활성 파라미터 수 350억의 MoE 모델이며 MAI-Code-1-Flash는 파라미터 수 50억 소형 모델로 코딩 작업 고속 실행이 가능하다. MAI-Image-2.5는 이미지 생성 모델로 이미지 생성 세계 3위, 이미지 편집 세계 2위다. MAI-Image-2.5 Flash는 고속 이미지 생성 모델이며 MAI Transcribe-1.5는 43개 언어를 지원하는 고속·고정밀 음성 인식 모델, MAI-Voice-2는 15개 언어를 지원하는 음성 합성 모델, MAI-Voice-2 Flash는 고속 음성 합성 모델이다.

먼저 MAI-Thinking-1은 총 파라미터 수 1조, 활성 파라미터 수 350억인 MoE 모델. 학습 데이터에는 AI 생성 콘텐츠가 포함되지 않으며 적절한 라이선스가 부여된 클린 데이터만을 사용했다고 밝혔다. 또 마이크로소프트 자체 AI 칩 Maia 200 등 사내 인프라를 활용해 개발해 자급자족성을 확보했으며 타사 모델로부터의 지식 증류(distillation)는 수행하지 않았다고 명시했다.

MAI-Thinking-1, 클로드 소넷 4.6, 클로드 오퍼스 4.6, GPT-5.4, Kimi K2.6, DeepSeek V3.2, DeepSeek V4, GLM-5.1 등 각종 벤치마크 결과를 정리한 표에 따르면 MAI-Thinking-1은 수학 문제 풀이 능력을 측정하는 AIME 2025에서 클로드 소넷 4.6을 앞섰다. 다른 벤치마크에서는 클로드 소넷 4.6보다 낮은 점수를 기록했지만 마이크로소프트는 1,276개 과제를 수행하는 능력을 인간이 평가한 결과 MAI-Thinking-1이 클로드 소넷 4.6보다 높은 성능을 지닌다고 평가됐다고 강조했다.

MAI-Thinking-1은 마이크로소프트 파운드리에서 프라이빗 프리뷰로 제공되기 시작했으며 MAI 플레이그라운드에서도 이용 가능해질 예정이다.

다음으로 MAI-Code-1-Flash는 총 파라미터 수 50억인 코딩 모델이다. MAI-Code-1-Flash와 클로드 하이쿠 4.5 벤치마크 점수를 비교한 그래프에 따르면, MAI-Code-1-Flash는 일관되게 클로드 하이쿠 4.5보다 높은 점수를 기록하고 있다. MAI-Code-1-Flash는 비주얼 스튜디오 코드와 깃허브 코파일럿에서 순차적으로 이용 가능해질 예정이다.

또 MAI-Image-2.5는 피사체와 장면 구조, 조명, 크기, 공간적 관계를 고도로 추론해 고품질 이미지를 생성할 수 있는 이미지 생성 AI다. 이미지 내에 지시에 따른 텍스트를 렌더링하는 성능도 뛰어나다. MAI-Image-2.5는 AI 랭킹 서비스 아레나(Arena)에서 텍스트-이미지 생성 부문 3위, 이미지 편집 부문 2위에 올랐다. MAI-Image-2.5 Flash는 MAI-Image-2.5 대비 고속·고효율 모델로 제공된다.

두 모델은 마이크로소프트 파운드리 API를 통해 이용 가능하다. MAI-Image-2.5 100만 토큰당 API 요금은 텍스트 입력 5달러, 이미지 입력 8달러, 이미지 출력 47달러다. MAI-Image-2.5 Flash 100만 토큰당 API 요금은 텍스트 입력 1.75달러, 이미지 입력 1.75달러, 이미지 출력 19.50달러다.

MAI Transcribe-1.5는 43개 언어를 지원하는 음성 인식 모델이다. 제3자 기관 아티피셜 애널리시스(Artificial Analysis)가 실시한 오류율 테스트 결과 MAI Transcribe-1.5는 전 세대 모델인 MAI Transcribe-1보다 오류율이 낮아 상당히 높은 정확도를 갖춘 모델로 평가됐다. 또 낮은 오류율과 빠른 처리 속도를 동시에 달성한 것으로 나타났다. MAI Transcribe-1.5는 API를 통해 이용 가능하다.

MAI-Voice-2는 15개 언어를 지원하는 음성 합성 모델이다. 사람 목소리를 입력하면 동일한 음성으로 임의의 단어를 발화시키는 음성 클로닝이 가능하다. MAI-Voice-2로 합성한 음성과 실제 인간의 녹음 음성 중 어느 쪽이 더 자연스러운지를 인간이 평가한 결과 MAI-Voice-2가 실제 인간과 동등한 수준으로 평가된 것으로 나타났다.

MAI-Voice-2는 API를 통해 이용할 수 있다. 저비용·고효율 모델인 MAI-Voice-2 Flash도 출시될 예정이다. 관련 내용은 이곳에서 확인할 수 있다.

◇ AI 에이전트 중심 차세대 컴퓨팅 플랫폼 비전 제시=마이크로소프트는 AI 에이전트 전용 디바이스를 위한 새 플랫폼으로 프로젝트 솔라라(Project Solara)도 발표했다. 윈도가 아닌 안드로이드 기반 OS로 에이전트 중심 시스템을 구축한다는 구상.

마이크로소프트는 프로젝트 솔라라를 단순한 OS가 아닌 디바이스와 클라우드를 아우르는 칩-투-클라우드(chip-to-cloud) 플랫폼으로 규정하며 기존 앱 중심 컴퓨팅이 아닌 에이전트 중심 경험 실현을 목표로 내세웠다.

프로젝트 솔라라는 마이크로소프트 스티븐 배티치(Steven Bathiche)가 이끄는 응용과학그룹(Applied Sciences Group) 주도로 추진되는 프로젝트다. AI 에이전트가 새로운 프로그래밍 단위이자 새로운 인간-기계 인터페이스가 된다는 개념에서 출발한다. 마이크로소프트는 메인프레임, PC, 스마트폰, 스마트워치로 이어지는 흐름처럼 컴퓨터 형태는 시대마다 더 전문화되고 사용자와 작업에 더 가까이 이동해왔다고 설명했다.

마이크로소프트는 프로젝트 솔라라에 대해 사용자 에이전트, 작업, 환경에 맞춘 에이전트 퍼스트(agent-first) 경험을 만드는 걸 목표로 한다고 밝혔다. 여기서 말하는 에이전트란 단순히 질문에 답하는 AI가 아니라 여러 앱과 서비스, 디바이스에 걸쳐 맥락을 유지하고 작업을 조율하며 필요한 시점에 사용자의 의도에 따라 움직이는 존재로 상정된다.

마이크로소프트는 AI 애플리케이션의 진화에 3단계가 있다고 설명했다. 첫 번째는 코파일럿처럼 기존 앱을 보조하는 비사이드 AI(Beside AI), 2번째는 오피스 리서처(Researcher)나 에이전트 모드처럼 앱 조작 모델 자체를 바꾸는 인사이드 AI(Inside AI), 3번째는 여러 앱과 워크플로, 디바이스를 넘나들며 동작하는 아웃사이드 AI(Outside AI)다. 이 진화 과정에서 프로젝트 솔라라는 앱을 여는 경험에서 지능을 호출하는 경험으로의 전환을 전제로 한다. 마이크로소프트는 버튼과 메뉴를 따라가는 그래픽 UI 중심 조작에서 벗어나 사용자가 의도를 표현하면 에이전트가 작업 환경과 워크플로를 넘나들며 추론하는 조작으로 이행한다고 설명했다.

프로젝트 솔라라 기반은 윈도가 아닌 AOSP(Android Open Source Project)를 토대로 한 MDEP(Microsoft Device Ecosystem Platform)다. 마이크로소프트는 MDEP가 보안·신뢰성·도입 용이성·혁신을 중시한 엔터프라이즈급 OS로 디바이스 제조사가 대규모로 구축·배포할 수 있도록 설계됐다고 밝혔다.

프로젝트 솔라라 디바이스 측 구성 요소에는 복수 클라우드 기반 에이전트를 동적으로 불러오고 조율하는 에이전트 셸(agent shell)이 포함된다. 또 IT 관리자가 PC나 모바일 디바이스와 동일하게 관리할 수 있는 마이크로소프트 인튠(Microsoft Intune), 기존 마이크로소프트 계정을 활용할 수 있는 엔트라 ID(Entra ID), 생체 인증 방식 헬로 포 비즈니스(Hello for Business), 물리적 마이크 음소거 버튼과 녹음·청취 상태 명시 등 프라이버시 기능도 포함될 예정이다.

나아가 중요한 기술 개념으로 저스트-인-타임 UI(just-in-time UI)가 제시됐다. 개발자가 새로운 화면 크기나 입력 방식마다 UI를 새로 만들지 않아도 에이전트가 디바이스·화면 크기·콘텐츠·음성·시각·터치 등 조작 모드에 맞게 표시와 조작 경험을 자동으로 조정한다는 개념이다. 다만 현 시점 프로젝트 솔라라는 기존 반응형 UI와 완전 생성형 UI 중간 단계에 위치하며 어댑티브 카드(Adaptive Cards)나 기존 콘텐츠 타입 같은 반구조화된 방식에서 출발한다는 방침이다. 마이크로소프트는 AI가 프레임 단위로 UI를 완전히 생성하는 미래는 아직 도래하지 않았다고 밝혔다.

마이크로소프트가 프로젝트 솔라라의 핵심 축으로 내세운 건 프라이버시·보안·제어·신뢰를 갖춘 엔터프라이즈 대응, 저스트-인-타임 UI를 활용한 에이전트 주도 인터랙션, 독자 에이전트를 연동할 수 있는 확장성이다. 그 중에서도 기업 환경에서는 데이터·도메인·ID·조직의 경계를 존중하면서 복수의 에이전트를 일관된 경험으로 통합하는 게 중요하다고 강조했다.

마이크로소프트는 코딩·분석·커뮤니케이션·의료·현장 작업 등 용도와 조직마다 서로 다른 전문 에이전트가 존재하는 세계를 상정하며 프로젝트 솔라라에서도 단일 만능 에이전트를 전제로 하지 않는다. 이에 따라 필요한 상황에서 적절한 에이전트를 호출하는 에이전트 디스패처(agent dispatcher)와 에이전트 작업을 관리하는 에이전트 태스크 매니저(agent task manager) 같은 기술도 함께 개발 중이라고 밝혔다.

마이크로소프트는 프로젝트 솔라라 구현을 시험하기 위해 휴대형 배지 컨셉(Badge Concept)과 거치형 데스크 컨셉(Desk Concept)이라는 2가지 레퍼런스 디자인도 공개했다. 배지 컨셉에는 퀄컴이, 데스크 컨셉에는 미디어텍이 실리콘 파트너로 협력한다.

배지 컨셉은 출입증이나 사원증처럼 몸에 착용하는 소형 디바이스다. 퀄컴 웨어러블 디바이스용 칩을 탑재하고 터치스크린·지문 인증·카메라·마이크·스피커·5G 통신 등을 갖췄다. 사용자는 인증 후 곧바로 에이전트에 접근하거나 대화를 녹음해 텍스트로 변환할 수 있다.

데스크 컨셉은 책상 위에 놓고 사용하는 스마트 디스플레이형 디바이스다. 얼굴 인증·터치스크린·마이크·스피커·UWB 센서·USB-C 포트 등을 갖추며 단독으로 사용할 수 있을 뿐 아니라 윈도 PC 보조 디바이스나 윈도 365 클라이언트로도 활용 가능하다.

마이크로소프트 사내에서는 이미 직원 수백 명이 배지 컨셉과 데스크 컨셉을 시험 사용 중이다. 마이크로소프트 365 코파일럿과 리서처, 퍼실리테이터(Facilitator), 프라이어리티 에이전트(Priority Agent) 등과 연동해 일일 브리핑, 회의 기록, 액션 아이템 추출, 중요 알림 정리 등 용도가 상정된다.

마이크로소프트는 깃허브 코파일럿과 의료 현장용 AI 어시스턴트인 드래곤 코파일럿(Dragon Copilot)에도 프로젝트 솔라라를 응용할 계획이다. 개발자를 위해서는 마이크로소프트 365 코파일럿 확장, 코파일럿 스튜디오, 마이크로소프트 365 에이전트 SDK, 마이크로소프트 에이전트 프레임워크 등을 활용한 에이전트 구축 경로도 제시됐다.

마이크로소프트는 프로젝트 솔라라를 활용한 에이전트 퍼스트 디바이스의 프라이빗 파일럿을 애큐웨더(AccuWeather)·베스트 바이·CVS 헬스·리바이스·타깃 등 여러 기업과 함께 2026년 내에 시작할 예정이다. 다만 프로젝트 솔라라는 아직 초기 단계이며 이번에 발표된 두 디바이스도 시판 예정 제품이 아닌 제조사와 개발자를 위한 참고 설계에 불과하다. 관련 내용은 이곳에서 확인할 수 있다.

◇ 로컬 AI 개발을 위한 고성능 개발자용 AI PC 발표=한편 마이크로소프트는 엔비디아 RTX 스파크(RTX Spark)를 탑재한 개발자용 PC인 서피스 RTX 스파크 데브 박스(Surface RTX Spark Dev Box)를 발표했다. 로컬 환경 내 AI 개발을 위해 설계된 PC로 최대 1PFLOPS 처리 성능을 갖췄다.

AI 모델은 기능과 복잡성이 날로 증가하고 있으며 에이전트 워크플로는 지속적인 컴퓨팅 능력을 필요로 한다. 이 때문에 최첨단 AI 모델이 필요하지 않은 작업이라도 반복 작업마다 클라우드 비용이 발생할 수 있다.

서피스 RTX 스파크 데브 박스는 이런 상황을 일변시키기 위해 개발된 개발자용 PC다. 최대 1페타플롭스 컴퓨팅 능력을 갖추고 있으며 강력한 AI 컴퓨팅 성능을 엣지 환경에 제공해 개발자가 최첨단 모델 호출을 진정한 최첨단 문제에 한정하고 나머지는 자신의 하드웨어로 처리할 수 있게 한다. 이를 통해 개발자는 컴퓨팅 예산 배분을 직접 통제할 수 있게 되며 보다 효율적이고 응답성 높은 개발 워크플로 구현이 가능해진다.

서피스 RTX 스파크 데브 박스 핵심은 엔비디아 RTX 스파크다. RTX 스파크는 엔비디아가 6월 1일 발표한 SoC로 1페타플롭스인 블랙웰(Blackwell) GPU, 20코어 그레이스(Grace) CPU, 128GB 유니파이드 메모리를 탑재하고 있다.

이를 통해 1,200억 개 이상 파라미터를 가진 AI 모델을 100만 토큰 컨텍스트로 로컬에서 인터랙티브한 속도로 실행하거나 기존에 클라우드 GPU 인스턴스가 필요했던 AI 모델을 파인튜닝하기에 충분한 연산 능력을 확보할 수 있다.

또 서피스 RTX 스파크 데브 박스는 히트싱크 역할을 하도록 설계된 알루미늄 섀시를 채택했다. 이를 통해 개발자에게 중요한 워크로드인 장시간 실행되는 트레이닝 작업, 대규모 모델 추론, 일관된 지속적 성능이 요구되는 복잡한 에이전트 파이프라인도 처리 가능하다.

서피스 RTX 스파크 데브 박스에는 개발자를 위해 이미지 수준에서 사전 설정된 윈도 11 프로가 탑재된다. 이를 통해 의도적인 기본 설정, 사전 설치된 도구, 조정된 설정이 제공되며 최초 로그인 시점부터 개발 환경을 기본으로 이용할 수 있다.

이 설정은 개발자가 작업에 집중할 수 있도록 배려한 것으로 다크 테마·개발용으로 간소화된 작업 표시줄·위젯 제거·방해 금지 모드 활성화·개발자 모드 활성화가 적용된다. 기본 셸은 파워셸 7이다.

WSL 2는 GPU 패스스루와 쿠다(CUDA) 지원이 구성되어 있다. 또 VS 코드, 깃허브 코파일럿, 깃(Git), 파이썬, Node.js도 설치되어 있다. 윈도 환경과 WSL 환경 모두에서 선호하는 IDE, 에이전트, 코딩 어시스턴트, 프레임워크, 라이브러리를 서피스 RTX 스파크 데브 박스에서 모두 구동할 수 있다.

기밀성이 높은 AI 모델이나 독자 데이터를 다루는 개발자, 귀중한 지식재산을 취급하는 개발자에게 적합한 선택지가 될 수 있도록 보안도 중시됐다. 강력한 GPU와 유니파이드 메모리를 통해 더 많은 AI 모델과 지식재산을 로컬에서 보유할 수 있어 개발자가 AI 모델과 데이터를 로컬에서 더 폭넓게 관리하는 것이 가능하다.

한편 서피스 RTX 스파크 데브 박스의 외형 대해서는 멀리서 보면 납작한 엑스박스 시리즈 X처럼 보인다는 지적도 나왔다. 관련 내용은 이곳에서 확인할 수 있다.

◇ 양자비트 안정성 대폭 높인 차세대 토폴로지컬 양자칩 공개=마이크로소프트는 그 밖에 마이크로소프트 디스커버리(Microsoft Discovery) AI 에이전트를 활용해 개발한 차세대 토폴로지컬 양자 칩 마요라나 2Majorana 2)를 발표했다. 마요라나 2는 전 세대 양자 칩 대비 양자 비트 신뢰성이 1,000배 향상됐으며 평균 양자 비트 수명은 20초, 인스턴스 지속 시간은 최대 1분에 달한다. 마이크로소프트는 이를 통해 2029년까지 확장 가능한 양자 컴퓨터를 실현할 수 있을 것으로 전망했다.

마요라나 2 양자 비트는 1세대 양자 비트보다 1,000배 더 오래 양자 상태를 유지할 수 있다. 이를 통해 기존 양자 칩보다 신뢰성 높은 연산이 가능해진다. 다른 일반적인 방식에서는 양자 비트 수명을 마이크로초 단위로 측정하는 반면 마요라나 2는 평균 20초 양자 비트 수명을 실현했으며 경우에 따라서는 1분간 지속되기도 한다. 이 차이에 대해 마이크로소프트는 하루 만에 방전되던 휴대폰 배터리가 한 번 충전으로 3년 가까이 사용 가능해지는 것에 필적하는 거대한 진보라고 표현했다.

마이크로소프트는 상업적으로 가치 있는 확장 가능한 양자 컴퓨터가 실현되면 건강·식량 공급·지속 가능성·에너지 생산 등 해결이 어려운 문제들에 대응할 수 있게 된다고 설명했다.

마요라나 1은 토폴로지컬 초전도체라는 특수한 물질을 활용해 보다 안정적인 양자 컴퓨팅을 가능하게 하는 완전히 새로운 물질 상태를 만들어낼 수 있다는 점에서 획기적이었다. 마요라나 1이 초전도체로 알루미늄을 사용한 반면 마요라나 2는 납을 사용한다. 양자 컴퓨터에서 납 초전도체는 불안정해지기 쉬운 양자 비트를 우주에서 유래한 외란으로부터 보호하는 데 도움이 된다. 다만 다른 트레이드오프를 극복하는 방법을 찾는 데는 수년이 걸렸다고 한다.

마요라나 2 핵심 부분은 원자 하나하나를 설계해 제작된다. 각 원자를 올바른 위치에 고정하기 위해 결정 구조에 불순물이라 불리는 다른 물질이 첨가되는 경우가 있다. 하지만 불순물 첨가량이 너무 많거나 첨가 방법이 잘못되면 구조가 흐트러지기 때문에 적절한 균형을 맞추기가 어렵다.

줄피 알람(Zulfi Alam) 마이크로소프트 부사장은 기존 방식에서는 정확한 배합 그러니까 원하는 에너지 구조를 얻기 위해 필요한 적절한 양을 찾으려면 많은 실험이 필요했지만 새로운 방식에서는 시뮬레이션을 통해 가장 가능성 높은 목표 지점이 어디에 있는지 파악할 수 있다며 그 지식이 있으면 이상적으로는 실험 한 번으로 충분하다고 말했다.

한편 양자 프로젝트에는 20년치에 이르는 다양한 형식 데이터가 축적되어 있다. AI 등장 이전에는 이 데이터가 사일로화된 상태로 보관됐다. 연구팀은 이 데이터에 AI 에이전트를 적용해 인간이 발견할 수 없었던 상관관계를 재구성하고 도출해낼 수 있었다고 밝혔다.

마이크로소프트는 6월 2일부터 조직이 최첨단 연구개발에 임할 수 있도록 지원하는 종합 플랫폼인 마이크로소프트 디스커버리 일반 제공도 시작했다. 마이크로소프트 디스커버리는 과학 연구개발에 특화된 AI 에이전트, 연구 및 추론 워크플로를 지원하는 디스커버리 엔진(Discovery Engine), 엔터프라이즈 수준 보안·거버넌스·투명성을 갖추고 있다.

마이크로소프트는 또 초기 프리뷰 버전으로, 개인이 무료로 다운로드해 깃허브 코파일럿 계정을 이용해 자신의 컴퓨터에서 로컬로 실행할 수 있는 핵심 기능을 갖춘 마이크로소프트 디스커버리 앱도 발표했다.

마이크로소프트 디스커버리 앱을 사용하면 연구자는 인간 전문 지식 안내를 받는 자율형 에이전트 팀을 배치할 수 있다. 이 팀은 방대한 지식을 바탕으로 추론을 수행하고, 가설을 생성하며 실험을 최적화하고 이론을 검증하며 지속적인 루프 안에서 학습하는 게 가능하다. 내장된 제어 기능을 통해 연구가 우선순위, 보안 및 컴플라이언스 기준, 안전 요건에 부합하도록 보장된다. 관련 내용은 이곳에서 확인할 수 있다.