x

이메일로 만나보는 스타트업 가이드

투자, 행사, 정부사업 등 스타트업 생태계 소식을 이메일로 편하게 받아보세요.

1월 14일 오픈AI가 세레브라스(Cerebras)와의 제휴를 발표했다. 세레브라스는 AI 모델 장시간 출력을 고속화하기 위해 전용 AI 시스템을 구축하는 기업.

이번 양사간 제휴로 오픈AI 컴퓨팅 솔루션에 세레브라스 AI 시스템이 통합된다. 오픈AI 측은 이를 통해 AI 응답 속도가 대폭 향상될 것이라고 설명했다.

정보에 따르면 양사간 거래 규모는 100억 달러를 초과한다고 한다. 오픈AI는 세레브라스 저지연 시스템을 단계적으로 추론 스택에 통합해 워크로드 전반으로 확대해 나갈 예정이라고 설명했다. 구체적으로는 750MW 초저지연 AI 컴퓨팅을 오픈AI 플랫폼에 추가할 계획이라고 밝혔다.

양사는 2017년 이래 빈번하게 회합을 열고 연구 성과와 초기 단계 노력을 공유하며 AI 모델 스케일에는 하드웨어 아키텍처가 융합되어야 한다는 공통 신념을 공유해 왔다고 한다. 이번 제휴는 바로 이를 실현하기 위한 것.

오픈AI 측은 자사 컴퓨팅 전략은 적절한 시스템을 적절한 워크로드에 매칭해 회복력이 높은 포트폴리오를 구축하는 것이라며 세레브라스는 자사 플랫폼에 전용 저지연 추론 솔루션을 추가하며 이는 더 빠른 응답, 더 자연스러운 상호작용, 더 많은 이들에게 실시간 AI를 확장하기 위한 견고한 기반이 될 것이라고 말했다.

세레브라스 CEO인 앤드루 펠드만(Andrew Feldman)은 오픈AI와의 제휴로 세계를 선도하는 AI 모델을 세계에서 가장 빠른 AI 프로세서에 탑재할 수 있게 되어 기쁘다며 브로드밴드가 인터넷을 변혁했듯 실시간 추론은 AI를 변혁하고 AI 모델 구축과 상호작용에 완전히 새로운 방법을 가져올 것이라고 말했다.

세레브라스 측에 따르면 저지연 추론 시스템에서 작동하는 대규모 언어모델(LLM)은 GPU 기반 시스템에서 작동하는 LLM과 비교해 응답 속도가 최대 15배 빨라진다고 한다. 이는 소비자에게 참여도 향상과 혁신적인 애플리케이션 활용으로 이어지는 큰 장점이라는 설명이다.

한편 세레브라스 저지연 추론 솔루션에 대해 오픈AI는 2028년까지 여러 차례에 걸쳐 가동할 예정이라고 설명했다. 세레브라스 측은 자사 750MW 웨이퍼 스케일 시스템을 도입하는 복수년 계약을 체결했다며 이 도입은 2026년부터 단계적으로 전개되며 세계 최대 규모 고속 AI 추론 시스템 도입이 될 것이라고 밝혔다. 관련 내용은 이곳에서 확인할 수 있다.

뉴스 레터 구독하기

Related Posts

No Content Available
Next Post