x

이메일로 만나보는 스타트업 가이드

투자, 행사, 정부사업 등 스타트업 생태계 소식을 이메일로 편하게 받아보세요.

딥시크(DeepSeek)가 수학적 추론에 특화된 AI 모델인 DeepSeek-Math-V2를 공개했다. DeepSeek-Math-V2는 정리 증명과 자기 검증 기능에 중점을 두고 있으며 기존 수학 AI 모델과 달리 해답에 대한 정확성을 추구할 뿐만 아니라 추론 과정의 엄밀성과 완전성도 중시하고 있다.

기존 대규모 언어 모델은 주로 최종 답이 맞는지 여부를 보상으로 제공하는 강화학습을 통해 훈련되어 왔다. 하지만 이 방법으로는 답이 우연히 맞더라도 중간 과정 사고방식이 틀린 경우를 간파할 수 없다. 그 중에서도 정리 증명과 같은 고난도 수학에서는 수치적 답이 존재하지 않고 엄밀한 논리의 축적 그 자체가 요구되기 때문에 기존 방법만으로는 한계가 있었다.

이런 과제를 해결하기 위해 채택된 기술이 증명을 작성하는 생성기와 그 증명이 올바른지 판정하는 검증기라는 2가지 모델을 협력시키는 아키텍처다.

DeepSeek-Math-V2 훈련은 3단계로 진행된다. 먼저 검증기를 훈련시키고 그 다음 검증기를 교사 역할로 삼아 생성기를 학습시킨다. 다음으로 생성기는 검증기로부터 피드백을 받으면서 자신의 증명에 포함된 오류를 특정하고 수정하도록 훈련된다. 그리고 검증을 위한 계산량을 늘림으로써 AI가 자동으로 어려운 증명에 대한 정오를 판단하고 이를 새로운 학습 데이터로 활용해 검증기 능력을 더욱 높이는 사이클을 구축한다.

이런 기술적 혁신을 통해 DeepSeek-Math-V2는 세계적인 수학 경시대회에서 높은 성적을 거두고 있다. 예를 들어 2025년 국제수학올림피아드(IMO)에서는 금메달 수준인 83.3%에 이르는 득점률을 기록했다. 또 캐나다수학올림피아드(CMO) 2024에서는 73.8%, 미국 대학 수준 경시대회인 Putnam 2024에서는 98.3%라는 놀라운 점수를 달성했다.

타사 고성능 모델과 비교해도 Gemini Deep Think나 Claude Sonnet 4 등을 상회하는 성과를 ProofBench라는 평가 지표에서 보여주고 있으며 난이도가 높은 문제에서 강점을 발휘하고 있다. DeepSeek-Math-V2는 DeepSeek-V3.2-Exp-Base를 기반으로 구축됐으며 허깅페이스에서 다운로드할 수 있다. 관련 내용은 이곳에서 확인할 수 있다.

뉴스 레터 구독하기

Related Posts

No Content Available
Next Post