x

이메일로 만나보는 스타트업 가이드

투자, 행사, 정부사업 등 스타트업 생태계 소식을 이메일로 편하게 받아보세요.

엔비디아가 수백만 토큰 입력을 지원하는 AI 처리 특화 GPU인 루빈 CPX(Rubin CPX)를 9월 9일 발표했다. 루빈 CPX는 장편 동영상 생성이나 긴 문맥을 필요로 하는 코딩 작업 등에서 기존 시스템 설계 한계를 크게 뛰어넘는 제품.

엔비디아에 따르면 AI 모델은 1시간짜리 영상 처리에 최대 100만 토큰이 필요하며 이는 기존 GPU 연산 한계에 근접한 수준이다. 루빈 CPX는 이런 한계를 확장하는 제품으로 비디오 디코더와 인코더, 장문맥 추론 처리를 단일 칩에 통합해 영상 검색이나 고품질 생성 영상 등 애플리케이션에서 전례 없는 성능을 구현한다.

루빈 CPX는 복잡한 AI 처리를 수행하는 분산 추론 접근법을 지원하도록 설계됐다. 보통 AI 추론은 문맥 단계와 생성 단계라는 2가지 과정으로 나뉜다. 문맥 단계는 대량 입력 데이터를 받아 분석하고 첫 토큰 출력을 생성하는 과정으로 높은 처리량이 요구된다. 반면 생성 단계는 토큰 단위 출력 성능을 유지하기 위해 빠른 메모리 전송과 NV링크 같은 고속 상호연결 기술에 의존한다. 분산 추론은 이 2단계를 독립적으로 처리해 연산 리소스와 메모리 리소스 각각에 특화된 최적화를 가능하게 하며 루빈 CPX는 이런 요구에 맞춰 개발된 칩이다.

루빈 CPX는 또 엔비디아 저정밀 추론 기술인 NVFP4를 적용해 최대 30페타플롭스 연산 성능을 구현한다. 여기에 128GB GDDR7 메모리와 엔비디아 SMART 프레임워크 등을 통합해 AI 워크로드 요구를 높은 효율성과 ROI로 충족하도록 설계됐다. 엔비디아 측은 1억 달러 투자마다 50억 달러 규모 토큰 수익을 창출할 수 있다며 높은 수익화를 강조했다.

아울러 엔비디아는 8엑사플롭스의 AI 연산 성능과 100TB 고속 메모리를 랙 하나에 탑재한 NVIDIA Vera Rubin NVL144 CPX 플랫폼도 함께 공개했다. 루빈 CPX는 이 플랫폼 내에서 엔비디아 Vera CPU와 루빈 GPU와 연동해 동작하며 기존 시스템인 NVIDIA GB300 NVL72보다 7.5배 향상된 AI 성능을 제공한다.

젠슨황 엔비디아 CEO는 Vera Rubin 플랫폼은 차세대 신카테고리 프로세서인 루빈 GPU와 루빈 CPX를 도입해 AI 컴퓨팅 최전선에서 새로운 도약을 이룬다며 RTX 시리즈가 그래픽스와 물리 AI에 혁신을 가져왔듯 루빈 CPX는 수백만 토큰 규모 지식을 동시에 추론하는 대규모 문맥 처리에서 비할 데 없는 성능을 보여줄 것이라고 말했다. 루빈 CPX는 2026년 말부터 제공될 예정이다. 관련 내용은 이곳에서 확인할 수 있다.

뉴스 레터 구독하기

Related Posts

No Content Available
Next Post