x

이메일로 만나보는 스타트업 가이드

투자, 행사, 정부사업 등 스타트업 생태계 소식을 이메일로 편하게 받아보세요.

중국 AI 스타트업인 딥시크(DeepSeek)는 2025년 1월 적은 계산 리소스로 높은 성능을 실현한 추론 모델 DeepSeek-R1을 오픈소스로 출시해 큰 화제를 모았다. 그런데 새로운 AI 모델인 DeepSeek-R2 출시는 중국 정부가 AI 모델 개발에 화웨이제 칩을 사용하도록 요구한 탓에 지연되고 있다는 보도가 나왔다.

DeepSeek-R1은 훈련 비용이 오픈AI 추론 모델 o1 3% 정도라고 알려져 있으며 비용 대비 이론적인 수익률이 하루 최대 545%에 달한다고 한다. 또 모델 데이터가 공개되어 있어 사용자가 서버나 로컬에서 실행할 수 있게 되어 있는 점도 주목받고 있다.

그런 딥시크 차세대 모델인 DeepSeek-R2는 5월 출시될 것이라고 보도됐지만 5월 말부터 2개월 이상이 지난 지금에서도 발표되지 않았다. 그 이유에 대해 중국 정부 개입이 원인이었다고 보도된 것.

사정에 정통한 증언자 3명에 따르면 중국 정부는 DeepSeek가 R1 학습에 성공하자 기존 엔비디아 하드웨어가 아닌 화웨이 AI 칩 Ascend 기반 플랫폼을 사용하도록 촉구했다고 한다.

딥시크는 중국 정부 지시를 받아들여 R2 개발에 화웨이제 칩을 도입했지만 곧바로 성능 불안정성과 칩 간 연결 지연, Ascend 소프트웨어 플랫폼 CANN 제한 등 문제에 직면했다.

화웨이는 문제 해결을 위해 딥시크 데이터센터에 엔지니어 팀을 파견했지만 Ascend 플랫폼에서의 훈련은 한 번도 성공하지 못했다고 한다. 정보 제공자는 딥시크가 화웨이 칩으로의 개발에 실패한 것으로 인해 R2 출시가 지연되고 있다고 말했다.

최종적으로 딥시크는 R2 모델 학습에는 엔비디아 칩을 사용하고 추론에는 화웨이 칩을 사용한다는 선택을 했다고 한다. 이 혼합 접근 방식은 선호라기보다는 필요에 의해 나온 타협안이라고 할 수 있다는 지적이다.

한편 중국에서는 엔비디아 칩이 부족하기 때문에 딥시크 고객 다수도 화웨이 하드웨어로 R2를 사용하게 된다. 이 점을 고려하면 새로운 AI 모델이 화웨이 하드웨어에서 동작하는 걸 보장하는 건 이치에 맞는다는 지적이다. 관련 내용은 이곳에서 확인할 수 있다.

뉴스 레터 구독하기

Related Posts

No Content Available
Next Post