x

이메일로 만나보는 스타트업 가이드

투자, 행사, 정부사업 등 스타트업 생태계 소식을 이메일로 편하게 받아보세요.

엔비디아가 주최하는 AI 콘퍼런스 GTC 2026 기조연설이 3월 16일 진행됐다. 기조연설에는 젠슨황(Jensen Huang) CEO가 등단해 차세대 AI 처리 시스템 세부 사항을 발표했다.

루빈(Rubin) GPU는 FP64 정밀도 기준 33TFLOPS의 높은 연산 능력을 발휘한다. 또 베라(Vera) CPU는 AI 및 HPC를 염두에 두고 설계된 CPU로 기존 CPU보다 2배 효율적이며 속도가 50% 향상됐다고 강조했다. 데이터센터용으로는 루빈 GPU 72개와 베라 CPU 36개를 탑재한 랙인 베라 루빈 NVL72(Vera Rubin NVL72)가 제공된다. 베라 루빈 NVL72 연산 능력은 FP64 정밀도 기준 2400TFLOPS에 달한다.

루빈 GPU에는 마이크론(Micron) HBM4가 탑재됐다. GPU 개당 메모리 용량은 288GB이며 베라 루빈 NVL72 전체 메모리 용량은 20.7TB다.

베라 루빈 시스템은 블랙웰(Blackwell) 세대 시스템 대비 5배의 가성비를 발휘한다고 밝혔다. 아울러 루빈 GPU, 베라 CPU, 엔브이링크 6 스위치(NVLink 6 Switch), 커넥트X-9 슈퍼닉(ConnectX-9 SuperNIC), 블루필드-4 DPU(BlueField-4 DPU), 스펙트럼-X 이더넷 코패키지드 옵틱스(Spectrum-X Ethernet Co-Packaged Optics), 그로크 3 LPU(Groq 3 LPU)를 탑재한 데이터센터용 랙 시스템도 등장했다.

엔비디아는 2025년 12월 추론 칩 개발 기업 그록과 라이선스 계약을 체결했다. 랙 시스템에는 그록 기술을 활용한 고효율 추론 서버 그록 3 LPX(Groq 3 LPX)가 포함됐다. 그록 3 LPX는 대역폭 40PB/s의 메모리를 128GB 탑재하며 315PFLOPS 추론 처리가 가능하다.

루빈 GPU와 그록 3 LPU를 결합해 전력·메모리·컴퓨팅 효율을 최대화하고 수조 개에 이르는 파라미터로 구성된 모델과 수백만 토큰에 달하는 컨텍스트에 대응할 수 있게 됐다.

베라 루빈 세대 제품은 이미 양산에 돌입했으며 올 하반기부터 AWS, 구글 클라우드, 마이크로소프트 애저 등 클라우드 프로바이더를 통한 서비스가 시작될 예정이다. 또 이미 앤트로픽, 커서(Cursor), 메타, 오픈AI, 퍼플렉시티, 블랙 포레스트 랩스(Black Forest Labs), 코히어, 하비, 미스트랄 AI 등 AI 기업과 제휴하고 있다는 것도 밝혀졌다. 관련 내용은 이곳에서 확인할 수 있다.

젠슨황 CEO는 이번 행사 기간 중 우주에서 작동하는 AI 처리 모듈인 스페이스-1 베라 루빈 모듈(Space-1 Vera Rubin Module)도 발표했다.

스페이스-1 베라 루빈 모듈은 루빈 세대 GPU를 탑재한 AI 처리 모듈로, 우주 공간에서 H100 대비 최대 25배 AI 연산 능력을 제공할 수 있다. 전력은 태양광 발전으로 공급하며 지상 데이터센터 수준 AI 처리 능력을 제공하는 게 가능하다. 이를 통해 대규모 언어 모델 및 고도화된 기반 모델을 우주 공간에서 직접 실행할 수 있다.

또 에너지 효율이 뛰어난 콤팩트한 AI 처리 모듈인 엔비디아 IGX 토르(NVIDIA IGX Thor)와 엔비디아 젯슨 오린(NVIDIA Jetson Orin)도 존재하며 궤도상 엣지 컴퓨팅을 실현할 수 있다.

젠슨황 CEO는 마지막 프런티어인 우주 컴퓨팅이 도래했다며 위성 콘스텔레이션을 전개해 심우주 탐사를 진행하려면 데이터가 생성되는 모든 곳에 인텔리전스가 존재해야 한다고 밝혔다. 이어 우주와 지상에 걸친 AI 처리는 실시간 센싱·의사결정·자율 동작을 가능하게 하고 궤도상 데이터센터를 탐사를 위한 장비로 변모시키며 우주선을 자동 항법 시스템으로 혁신한다면 자사는 파트너 기업과 함께 지구 밖으로 사업을 확장하고 인텔리전스를 지금껏 누구도 도달한 적 없는 영역으로 이끌어 나가겠다고 밝혔다.

엔비디아는 스타트업 스타클라우드(Starcloud)와 협력해 우주 공간에 5GW급 데이터센터를 설치하는 계획을 추진 중이다. 관련 내용은 이곳에서 확인할 수 있다.

한편 엔비디아는 이 자리에서 오픈소스 AI 에이전트 플랫폼인 오픈클로 커뮤니티를 위한 엔비디아 네모클로(NemoClaw)를 발표했다. 네모클로는 단일 명령어로 엔비디아 네모트론(Nemotron) 모델과 새롭게 발표된 엔비디아 오픈셸(OpenShell) 런타임을 설치할 수 있는 구조를 제공하며 클라우드 및 온프레미스 환경부터 엔비디아 RTX 탑재 PC까지 다양한 플랫폼에서 자율형 AI 에이전트의 안전하고 프라이빗한 운용을 가능하게 하는 인프라 계층을 제공한다.

네모클로는 2026년 3월 개발 중이라는 사실이 보도된 바 있다. 이번에 공식 발표된 네모클로는 오픈소스 AI 에이전트 플랫폼인 오픈클로 도입과 운용을 대폭 간소화하는 스택으로 오픈클로를 네모트론 모델 및 오픈셸 런타임과 함께 명령어 하나로 설치할 수 있도록 한다. 이를 통해 기존에는 복잡했던 AI 어시스턴트 구축이 누구에게나 접근하기 쉽고 확장성 높은 형태로 변화한다.

네모클로는 엔비디아 에이전트 툴킷(Agent Toolkit) 소프트웨어를 활용해 오픈클로 동작을 최적화하며 로컬 환경과 클라우드 환경을 자유롭게 조합하는 하이브리드 운용을 지원한다. 구체적으로는 사용자가 소유한 전용 시스템에서 네모트론 모델을 직접 구동할 수 있는 한편 더 고도화된 처리가 필요한 경우 프라이버시 라우터를 통해 클라우드상 첨단 모델을 활용하는 것도 가능하다. 이를 통해 에이전트는 정의된 틀 안에서 새로운 스킬을 학습하고 지속적으로 태스크를 완료하기 위한 기반을 마련할 수 있다.

폭넓은 동작 환경도 큰 강점으로 일반적인 지포스 RTX 탑재 노트북·데스크톱 PC부터 프로 사양 RTX PRO 워크스테이션, 나아가 DGX 스테이션(DGX Station)·DGX 스파크(DGX Spark) 같은 AI 슈퍼컴퓨터까지 모든 엔비디아 플랫폼에서 구동된다. 이처럼 다양한 하드웨어를 지원해 24시간 365일 항상 가동되는 상시 온(always-on) 자율형 에이전트를 실현하기 위한 전용 컴퓨팅 리소스가 제공된다.

네모클로의 안전성은 오픈셸이라는 런타임이 제공하는 강력한 가드레일과 다층적 보호 실드를 통해 구축된다. AI 에이전트는 샌드박스(sandbox)라고 불리는 메인 시스템과 분리된 안전한 격리 공간 안에서 동작하는 구조다. 이 격리 환경은 랜드락(Landlock)·섹컴프(seccomp)·넷엔에스(netns) 등 고도화된 기술로 구축되며 에이전트가 PC 내 중요한 설정을 임의로 변경하거나 관리 권한을 불법으로 취득하는 걸 사전에 방지한다.

네트워크 계층에서는 사전에 허가되지 않은 외부 접속이 모두 자동 차단된다. 에이전트가 목록에 없는 미지의 통신 대상에 접근하려 할 경우에는 조작 화면에 승인 요청 알림이 표시되며 사람이 허가하지 않는 한 통신은 이뤄지지 않는다. 파일시스템 계층에서는 에이전트가 읽고 쓸 수 있는 범위가 특정 디렉터리로만 한정되며 사용자 프라이빗 파일이 저장된 영역에는 일절 접근할 수 없도록 제한된다.

또 프로세스 계층에서는 OS 핵심부에 관련된 위험한 명령어를 차단해 시스템 자체에 대한 공격을 방지한다. 추론 계층에서는 AI 모델에 대한 문의가 직접 이뤄지는 게 아니라 반드시 오픈셸 게이트웨이를 경유하는 구조다. 이를 통해 AI와의 상호작용이 항상 감시·제어 하에 놓이며 클라우드를 통한 의도치 않은 데이터 유출을 억제하는 게 가능해진다.

네모클로는 현재 알파 단계 소프트웨어로서 아파치 2.0 라이선스로 깃허브에 공개되어 있다. 도입을 위해서는 우분투 22.04 LTS 이상 리눅스 환경, 노드.js 20 이상, npm 10 이상, 도커, 그리고 오픈셸 설치가 필수다.

젠슨황 CEO는 오픈클로를 개인용 AI를 위한 운영체제라고 칭하며 업계가 기다려온 소프트웨어의 새로운 르네상스 시작이라고 강조했다. 또 오픈클로 고안자인 피터 스타인바거(Peter Steinberger)는 엔비디아와의 협력을 통해 누구나 강력하고 안전한 AI 어시스턴트를 구축할 수 있는 가드레일을 제공할 수 있다고 밝혔다. 관련 내용은 이곳에서 확인할 수 있다.

한편 크리에이티브 소프트웨어 대기업 어도비가 엔비디아와 전략적 파트너십을 체결했다고 발표했다. 이번 파트너십에는 차세대 기반 어도비 파이어플라이(Adobe Firefly) 모델과 에이전트형 워크플로 제공이 포함된다.

어도비는 엔비디아와의 제휴를 통해 콘텐츠 수요 급증과 생성형 AI에 의한 크리에이티브 및 마케팅 워크플로의 변혁이 진행되는 가운데 자사 크리에이티브 및 마케팅 워크플로·모델·기술과 엔비디아 오픈 모델·라이브러리·연구·고속 컴퓨팅이 융합될 것이라고 밝혔다.

전략적 파트너십 주요 내용을 보면 먼저 차세대 어도비 파이어플라이 모델 제공. 어도비는 엔비디아 첨단 컴퓨팅 기술과 AI 기술을 활용해 창의성·생산성·마케팅을 위해 설계된 차세대 파이어플라이 모델을 제공한다고 선언했다. 이들 모델은 엔비디아 쿠다-X(NVIDIA CUDA-X)와 네모(NeMo) 라이브러리를 사용해 구축될 예정.

다음은 어도비 에이전틱 AI 이노베이션. 어도비는 개인화되고 안전하며 비용 효율적인 환경에서의 하이브리드 장기 실행 에이전틱 루프 기반으로 엔비디아 에이전트 툴킷(NVIDIA Agent Toolkit) 일부인 엔비디아 오픈쉘과 네모트론을 활용한다. 또 어도비 익스피리언스 플랫폼(Adobe Experience Platform)으로 강화되는 대규모 에이전틱 워크플로를 위해 에이전트 툴킷과 네모트론을 평가한다. 엔비디아는 엔지니어링 전문 지식, 소프트웨어 조기 접근권, 타깃형 시장 진입 지원을 제공한다고 밝혔다.

다음은 고충실도 클라우드 네이티브 3D 디지털 트윈으로 마케팅 콘텐츠 제작 혁신. 엔비디아 가속 컴퓨팅, 오픈USD(OpenUSD) 데이터 교환용 엔비디아 옴니버스(NVIDIA Omniverse) 라이브러리, 엔비디아 RTX 렌더링, 실시간 클라우드 스트리밍용 엔비디아 옴니버스 키트 앱 스트리밍을 어도비 생성 AI 및 워크플로 플랫폼과 통합해 브랜드 아이덴티티를 유지한 마케팅 콘텐츠 자동화를 위한 클라우드 네이티브 3D 디지털 트윈을 제작한다.

다음은 AI 문서 인텔리전스로 비즈니스 생산성 향상. 어도비는 네모트론의 기능을 어도비 아크로뱃(Adobe Acrobat)에 도입해 비즈니스 전문가·소비자·기업을 위한 AI 출력 질을 한층 높이고 생산성을 향상시킨다고 발표했다.

다음은 클라우드에서의 크리에이티브 워크플로 가속. 어도비는 엔비디아 쿠다를 사용해 프레임.io(Frame.io)의 확장 가능한 클라우드 콘텐츠 관리·워크플로·미디어 디코드·인텔리전스를 가속한다고 밝혔다. 이를 통해 이미지·비디오·3D·기타 크리에이티브 미디어 유형에서의 대규모 고속 시맨틱 검색, 생성적 제작, 인사이트를 실현한다.

마지막으로 공동 시장 진입 전략 수립. 어도비와 엔비디아는 어도비 파이어플라이 파운드리(Adobe Firefly Foundry)를 활용해 전 세계 기업 고객의 AI 이노베이션 접근 및 도입을 촉진하는 공동 시장 진입 전략을 수립한다고 밝혔다.

젠슨황 CEO는 AI는 모든 산업에 가능성을 재정의하는 힘을 부여하고 있다며 양사는 20년 이상 디자인과 창의성 한계를 넓히기 위해 협력해왔다며 이런 파트너십을 새로운 차원으로 끌어올리는 것으로 양사 연구개발팀을 결집해 쿠다를 활용해 어도비 인기 애플리케이션을 가속화하는 동시에 창의성을 재정의하고 고객 경험을 변혁하는 최첨단 세계 기반 모델을 공동으로 구축해 나갈 것이라고 밝혔다. 관련 내용은 이곳에서 확인할 수 있다.

뉴스 레터 구독하기

Related Posts

Next Post