
엔비디아가 12월 15일 특화형 에이전트 AI 개발 강화, AI 업계 전체 투명성, 효율성을 목적으로 설계된 오픈 AI 모델, 데이터, 라이브러리인 네모트론3(Nemotron 3) 패밀리를 발표했다. 네모트론3는 필요한 부분만 활성화시켜 멀티 에이전트를 효율적으로 가동하면서 비용을 절감하는 것을 가능하게 한다.
네모트론3 패밀리는 복수의 전문적인 에이전트를 조합한 MoE 모델로 300억 파라미터 소형 모델인 네모트론3 나노, 1000억 파라미터를 갖추고 토큰당 최대 100억 파라미터를 활성화할 수 있는 고정밀 추론 모델인 네모트론3 슈퍼, 5000억 파라미터로 토큰당 최대 500억 파라미터를 활성화할 수 있는 대규모 추론 엔진인 네모트론3 울트라 3가지 크기를 전개하고 있다.
네모트론 패밀리는 대규모 멀티 환경 동시 트레이닝을 가능하게 하는 고도의 강화학습 기법을 통해 우수 정밀도를 실현하는 동시에 획기적인 하이브리드 MoE 아키텍처를 통해 대규모 멀티 에이전트 시스템 용도에서 클래스 최고 수준 토큰 생성 기능을 발휘한다. 엔비디아에 따르면 네모트론3 나노는 지난 8월 네모트론3 나노2와 비교해 4배 높은 스루풋을 실현하고 있다고 한다.
AI 모델 분석을 수행하는 아티피셜애널리시스(Artificial Analysis)는 네모트론3 나노를 동급 최고 오픈이면서 효율적인 모델이라고 평가하며 코딩, 추론, 에이전트 벤치마크 전반에서 최상급 정밀도를 달성했다고 보고했다. 또 릴리스 전에 실시한 테스트에서는 초당 380토큰 출력 속도를 기록하며 지능 뿐 아니라 효율성에도 중점을 두어 속도와 성능의 매력적인 트레이드오프를 실현하고 있다는 설명이다.
또 네모트론3 슈퍼와 울트라는 메모리 요구사항을 대폭 줄이고 트레이닝을 고속화하는 효율성을 갖추고 있다. 이를 통해 고정밀 포맷과 비교해 정밀도를 희생하지 않으면서 기존 인프라스트럭처 위에서 더 대규모 모델을 트레이닝하는 게 가능하다. 네모트론3 슈퍼와 울트라는 엔비디아 블랙웰 아키텍처 위에서 동작하며 NVFP4 트레이닝 포맷을 채택해 메모리 요구사항을 줄이고 기존 인프라에서의 대규모 학습을 가능하게 한다.
네모트론은 엔비디아의 더 광범위한 AI 관련 노력을 지원하고 있으며 전 세계 조직이 자체 데이터, 규제, 가치관에 부합하는 AI 시스템을 구축할 수 있는 오픈하고 투명성이 높으며 효율적인 모델을 채택하고 있다. 엔비디아 젠슨황 CEO는 오픈 이노베이션은 AI 진보 기반이라며 네모트론을 통해 고도의 AI를 오픈 플랫폼으로 변혁하고 개발자가 대규모 에이전트 시스템을 구축하는 데 필요한 투명성과 효율성을 제공한다고 말했다.
네모트론3 나노는 허깅페이스 등 복수 플랫폼에서 다운로드할 수 있다. 또 네모트론용으로 공개된 데이터세트에는 3조 토큰 규모 프리트레이닝 데이터, 포스트트레이닝 데이터, 강화학습 데이터가 포함되어 있으며 라이브러리도 오픈소스로 제공되고 있다. 네모트론3 슈퍼와 울트라는 2026년 상반기에 릴리스될 예정이다. 관련 내용은 이곳에서 확인할 수 있다.
![[AI서머리] 신보, 지방시대 지원 협의회 개최‧티모넷, 日 요코하마 ‘더 무비엄’ 특별 협력사 참여](https://startuprecipe.co.kr/wp-content/uploads/2025/12/251218_prkorea.co_.kr_06030464-75x75.jpg)

