x

이메일로 만나보는 스타트업 가이드

투자, 행사, 정부사업 등 스타트업 생태계 소식을 이메일로 편하게 받아보세요.

메타는 브로드컴(Broadcom)과 협력해 AI 칩 MTIA(Meta Training and Inference Accelerator)를 개발하고 있다. 3월 11일에는 MTIA 시리즈 칩으로 MTIA 300, MTIA 400, MTIA 450, MTIA 500 4종이 일제히 발표됐다. 이 중 MTIA 300은 이미 양산에 돌입했으며 나머지 칩도 2027년까지 양산될 예정이다.

보통 칩 설계 시작부터 양산까지는 2년이라는 시간이 필요하다. 메타는 이 때문에 급속한 AI 발전에 발맞추려면 어느 정도 도박적 요소가 필요하다고 지적했다. 메타는 칩 설계 내 불확실한 요소를 줄이기 위해 모듈식 칩렛을 짧은 사이클로 전개한다는 전략을 채택했으며 2027년까지 2년간 MTIA 300, MTIA 400, MTIA 450, MTIA 500이라는 AI 칩 4종을 양산할 수 있게 됐다.

먼저 MTIA 300은 R&R(ranking and recommendation)이라는 기법의 AI 학습에 최적화된 칩으로 FP8 정밀도 기준 연산 성능은 1.2PFLOPs다. R&R은 생성 AI보다 이전 세대 워크로드로 분류되지만 MTIA 300 설계는 다른 칩 기반이 됐다. MTIA 300은 이미 양산 중이다.

다음으로 MTIA 400은 MTIA 300 개량판으로 R&R뿐 아니라 생성 AI에도 대응할 수 있도록 설계된 범용 칩이다. MTIA 300이 효율성을 중시했던 반면 MTIA 400은 주요 상용 제품에 필적하는 연산 성능을 실현하도록 설계됐으며 FP8 정밀도 기준 연산 성능은 6PFLOPs로 향상됐다.

MTIA 400은 랩 테스트가 완료된 단계로 데이터센터 도입을 위한 준비가 진행 중이다. 메타는 MTIA 400을 72개 탑재한 랙 이미지도 공개했다.

이어 MTIA 450은 MTIA 400을 기반으로 생성 AI에 특화되도록 최적화를 가한 칩이다. HBM 대역폭이 MTIA 400의 9.2TB/s에서 18.4TB/s로 2배 증가했으며 FP8 정밀도 기준 연산 성능은 7PFLOPs에 달한다. MTIA 450은 2027년 초 양산 시작 예정이다.

마지막으로 MTIA 500은 HBM 대역폭을 27.6MB/s로 향상시킨 칩으로 2027년 양산 시작 예정. 연산 성능은 FP8 정밀도 기준 10PFLOPs, MX4 정밀도 기준 30PFLOPs다.

MTIA 시리즈는 파이토치(PyTorch) 네이티브라는 점도 특징으로 개발자가 익숙한 생태계를 유지할 수 있다. 또 고빈도 칩 개발 및 도입에는 큰 비용이 수반되지만 칩 4종은 동일한 랙과 네트워크 인프라스트럭처를 사용하도록 설계되어 비용을 상쇄할 수 있다. 관련 내용은 이곳에서 확인할 수 있다.

뉴스 레터 구독하기

Related Posts

No Content Available
Next Post