中 딥시크-V4-프로, 75% 할인 영구화

중국 AI 기업 딥시크(DeepSeek)는 지난 4월 딥시크-V4 시리즈를 발표하며 기간 한정으로 API 요금 75% 할인 캠페인을 실시했다. 이 할인이 영구 적용된다는 발표가 나오면서 딥시크-V4-프로(DeepSeek-V4-Pro)가 가성비 뛰어난 모델로 주목받고 있다.

딥시크-V4는 총 파라미터 수 2,840억 개·활성 파라미터 수 130억 개인 딥시크-V4-플래시(DeepSeek-V4-Flash)와 총 파라미터 수 1조 6,000억 개·활성 파라미터 수 490억 개인 딥시크-V4-프로 두 종류가 존재한다. 두 모델 모두 오픈 모델로 무료 배포되며 딥시크 유료 API를 통해 실행하는 것도 가능하다.

딥시크는 딥시크-V4-프로에 대해 클로드-오퍼스-4.6-맥스, 지피티-5.4-엑스하이, 제미나이-3.1-프로-하이 같은 클로즈드 모델을 능가하는 성능을 지닌다고 강조하고 있다. 딥시크-V4-프로 성능은 제3자 기관 테스트에서도 확인됐다. 미국 국립표준기술연구소(NIST) 산하 AI 평가 기관인 인공지능표준화혁신센터(CAISI)는 딥시크-V4-프로가 GPT-5와 동등한 성능이라고 보고한 바 있다. 인공지능표준화혁신센터는 딥시크-V4-프로에 대해 미국 주요 AI 모델에 비해 8개월 뒤처져 있다고 평가하기도 했는데, 이는 달리 말하면 딥시크가 엔비디아 고성능 GPU 접근이 제한된 중국 기업임에도 미국 기업 대비 8개월 차이로 추격하고 있다는 의미다.

딥시크-V4-프로는 출시 직후부터 5월 5일까지 기간 한정으로 API 요금 75% 할인 캠페인이 진행됐다. 딥시크-V4-프로 100만 토큰당 API 요금은 통상 입력 1.74달러·캐시 입력 0.0145달러·출력 3.48달러이었지만 75% 할인 적용으로 입력 0.435달러·캐시 입력 0.003625달러·출력 0.87달러로 내려갔다.

이후 4월 29일에는 할인 기간을 2026년 5월 31일까지 연장하기로 결정했다. 그리고 5월 23일 75% 할인에 대한 영구 적용이 공식 발표됐다. 딥시크-V4-프로 할인 영구화는 인터넷상에서 큰 화제를 모으고 있으며 딥시크 전용 서드파티 코딩 에이전트 리즈닉스(Reasonix)도 주목을 받고 있다. 관련 내용은 이곳에서 확인할 수 있다.

한편 딥시크는 미국 기업 최첨단 AI에 필적하는 성능을 갖춘 오픈 모델을 공개하고 있으며 현재 700억 위안 규모 대규모 자금 조달을 위한 협상을 진행 중인 것으로 보도됐다. 이런 딥시크의 전략은 뭘까.

딥시크는 2025년 1월 당시 최첨단 모델이었던 오픈AI o1과 동등한 성능을 갖춘 모델인 DeepSeek-R1을 무료 공개하며 일약 유명세를 탄 기업. 올해 5월 등장한 DeepSeek-V4-Pro는 미국 정부 기관인 인공지능 표준화·혁신 센터(CAISI)로부터 GPT-5와 동등한 성능으로 미국 최첨단 모델에 8개월 뒤처진 위치에 있다는 평가를 받았다.

앞서 밝혔듯 딥시크-V4-프로는 모델이 무료로 공개되어 있는 것 외에 딥시크 유료 API를 통해서도 이용할 수 있다. API 사용 요금은 출시 초기부터 적용됐던 75% 할인이 영구화되며 높은 가격 대비 성능을 자랑하는 모델로 주목받고 있다.

딥시크는 최첨단 모델을 오픈 모델로 무료 공개하고 있으며 API 요금도 상당히 낮게 설정하고 있다. 알리바바(Alibaba)나 Z.ai 같은 중국 기업도 딥시크와 마찬가지로 최첨단 모델을 무료 공개하는 경향이 있지만 딥시크와 달리 에이전트 시스템 등을 구축해 수익화에 나서고 있다. 다시 말해 딥시크는 수익화를 위한 뚜렷한 움직임이 없음에도 불구하고 700억 위안 규모 자금 조달 협상을 진행할 수 있을 만큼 높이 평가받고 있는 셈이다.

전문가는 이런 높은 평가 이유로 압도적인 효율성을 꼽는다. 대규모 언어 모델에는 계산 처리 결과를 나중에 재사용할 수 있도록 하는 KV 캐시(KV Cache)라는 구조가 탑재되어 있는데 딥시크 KV 캐시는 효율적으로 설계되어 있다고 한다. 100만 토큰 입력을 처리할 때 메모리 사용량은 GLM-5가 60GB, Qwen3-235B-A22B가 89GB인 데 반해 딥시크-V4는 불과 5.48GB에 불과하다. AI 수요 증가에 따라 메모리 가격은 계속 오르고 있으며 AI 칩 비용 63%가 메모리로 GPU보다 메모리가 더 비싼 상황이 발생하고 있다. 이런 상황 속에서 딥시크 AI 모델이 갖춘 높은 효율성은 비용을 억제하면서도 수익을 낼 수 있는 구조를 만든다.

https://t.co/KHnPhxJBiz

— GDP (@bookwormengr) May 22, 2026

나아가 뛰어난 KV 캐시를 통해 효율적으로 캐시를 활용해 비교적 성능이 낮은 AI 칩으로도 출력까지 걸리는 시간을 단축할 수 있다. 딥시크-V4-프로는 구세대 모델 3.7분의 1, DeepSeek-V4-Flash가 구세대 모델의 9.8분의 1 연산량으로 처리를 완료할 수 있다.

중국에서는 엔비디아 고성능 AI 칩에 대한 접근이 엄격히 제한되어 있지만 딥시크는 성능이 낮은 AI 칩으로도 미국산 AI 모델에 가까운 속도로 추론이 가능하다.

전문가는 딥시크의 대규모 자금 조달이 단기적인 AI 개발을 목적으로 한 게 아니라 하드웨어 에코시스템 혁신이라는 장기적인 목적을 염두에 둔 것으로 추정하고 있다. 딥시크는 조달한 자금을 중국 메모리와 AI 칩 제조사에 환원해 AI 모델을 비용 효율적으로 학습하고 서비스 배포할 수 있는 에코시스템을 구축하려 하고 있다고 추측할 수 있다는 것. 중국 기업에 의해 비용 효율이 높은 AI 에코시스템이 구축된다면 전 세계 AI 개발 기업에게 유력한 선택지가 될 가능성이 있다.