x

이메일로 만나보는 스타트업 가이드

투자, 행사, 정부사업 등 스타트업 생태계 소식을 이메일로 편하게 받아보세요.

메타 4월 8일 슈퍼인텔리전스 랩스(Meta Superintelligence Labs)가 개발한 새로운 AI 모델 뮤즈 스파크(Muse Spark)를 공개됐다. 뮤즈 스파크는 개인용 슈퍼인텔리전스 실현을 목표로 하는 뮤즈(Muse) 패밀리 첫 모델로 메타가 자사 AI 개발 체제를 근본부터 재편한 첫 번째 결과물로 자리매김하고 있다.

뮤즈 스파크는 네이티브 멀티모달 추론 모델로 설계됐으며 툴 활용, 시각적 사고 과정 활용, 복수 에이전트 협조 실행을 지원하는 게 특징이다. 메타에 따르면 뮤즈 스파크는 멀티모달 인식, 추론, 헬스케어 분야, 에이전트형 태스크에서 경쟁력 있는 성능을 보이는 한편 장기적인 에이전트 동작이나 코딩 워크플로 같은 분야에서는 여전히 성능 향상 여지가 있다고 밝혔다.

메타는 뮤즈 스파크가 시각적 STEM 문제, 사물 인식, 위치 특정 등에서 높은 성능을 발휘한다고 설명했다. 이런 능력을 결합해 예컨대 미니게임 제작을 지원하거나 가전제품 트러블슈팅 시 동적 주석을 달아 안내하는 등 인터랙티브한 경험을 구현할 수 있다고 밝혔다.

헬스케어 분야도 뮤즈 스파크 주요 활용처 중 하나로 꼽혔다. 메타는 뮤즈 스파크 건강 관련 추론 능력을 높이기 위해 1,000명이 넘는 의사와 협력해 학습 데이터를 구축했다고 밝혔으며 식품 영양 성분이나 운동 시 사용되는 근육 등에 대해 보다 사실에 기반한 포괄적인 답변과 인터랙티브한 표시를 생성할 수 있도록 했다고 설명했다.

아울러 메타는 복수 에이전트가 병렬로 추론하는 컨템플레이팅 모드(Contemplating mode)도 발표했다. 이는 제미나이 딥씽크나 GPT 프로 같은 고급 추론 모드에 대항하기 위한 구조로 메타에 따르면 이 모드에서 HLE(Humanity’s Last Exam)에서 58%, FSR(FrontierScience Research)에서 38%를 기록했다고 한다. 컨템플레이팅 모드는 단계적으로 meta.ai에 배포될 예정.

모델 효율성 측면에서 메타는 지난 9개월간 사전학습 스택을 쇄신하고 아키텍처, 최적화, 데이터 큐레이션을 개선했다고 밝혔다. 그 결과 기존 라마 4 매버릭(Llama 4 Maverick)과 동일한 수준 성능에 도달하는 데 필요한 연산량을 10분의 1 이하로 줄일 수 있게 됐으며 비교 대상이 되는 주요 모델보다 효율적이라고 설명했다.

메타는 강화학습을 통한 개선도 강조했다. 대규모 강화학습은 불안정해지기 쉽지만 뮤즈 스파크에서는 연산량 증가에 따라 완만하고 예측 가능한 성능 향상이 나타났으며 학습 데이터에 포함되지 않은 평가 태스크에서도 정확도 향상이 확인됐다고 밝혔다.

추론 시 효율화 측면에서는 답변 전에 사고하는 테스트 타임 리즈닝(test-time reasoning)을 중시하면서 사고 토큰 활용 방식을 최적화하는 구조를 도입했다. 메타에 따르면 사고 시간에 페널티를 부과하면서 정답률을 극대화하도록 학습시켜 문제에 따라서는 추론을 더 적은 토큰으로 압축하면서도 성능을 유지하거나 향상시킬 수 있게 됐다고 한다.

또 단일 에이전트에 오래 사고하게 하는 것 뿐 아니라 복수 에이전트를 병렬로 연계시켜 응답 지연을 크게 늘리지 않고도 성능을 높일 수 있다고 밝혔다.

안전성과 관련해 메타는 선진 AI 스케일링 프레임워크에 따라 배포 전 광범위한 평가를 실시했으며 생물무기·화학무기 같은 고위험 분야에서 높은 거부 성능을 보였다고 보고했다. 생물무기 관련 거부율의 경우 뮤즈 스파크 98.0%, 오퍼스 4.6 95.4%, GPT 5.4 74.7%, 제미나이 3.1 프로 61.5%, 키미 K2.5 21.2%였다고 밝혔다. 메타는 사이버보안 및 통제 불능 리스크 영역에서도 현행 배포 조건 하에서는 위협 시나리오를 성립시킬 자율적 능력이나 위험한 경향은 확인되지 않았다고 밝혔다.

한편 제3자 기관인 아폴로 리서치(Apollo Research)는 뮤즈 스파크가 평가 환경을 강하게 의식하는 경향을 보였다고 보고했다. 메타에 따르면 모델은 일부 설문을 얼라인먼트 함정으로 인식하고 평가 중이기 때문에 솔직하게 행동해야 한다고 추론하는 경우가 있었다고 한다. 다만 메타는 이 특성이 위험 능력과 직결된다고는 확인되지 않았으며 현시점에서는 공개를 막을 요인은 아니라고 판단했다.

보도에선 뮤즈 스파크를 메타 AI 전략 재편을 상징하는 모델로 자리매김했다. 메타 슈퍼인텔리전스 랩스가 기존 라마 계열 모델 발전에 대한 불만을 배경으로 설립된 점, 메타가 스케일 AI(Scale AI) 공동창업자 겸 전 CEO인 알렉산더 왕(Alexander Wang)을 영입하고 스케일 AI에 143억 달러를 투자해 지분 49%를 취득한 사실도 언급했다. 또 헬스케어 분야 진출과 메타 계정 로그인 필수라는 사양으로 인해 프라이버시 측면 우려가 제기될 수 있다고 지적했다.

메타는 앞으로도 더 고성능 모델군을 지속적으로 출시하며 개인용 슈퍼인텔리전스로 나아가는 행보를 이어가겠다고 밝혔다. 뮤즈 스파크는 그 첫걸음으로 멀티모달성, 추론 능력, 툴 활용, 다중 에이전트 처리, 안전성 평가를 결합한 새로운 기반 모델로 제시됐다.

한편 뮤즈 스파크는 현재 meta.ai와 메타 AI 앱에서 이용할 수 있으며 일부 사용자를 대상으로 비공개 API 프리뷰도 시작된다. 이용 시에는 페이스북이나 인스타그램 등 기존 메타 계정으로의 로그인이 필요하다. 관련 내용은 이곳에서 확인할 수 있다.

뉴스 레터 구독하기

Related Posts

No Content Available
Next Post