“GPT-4.1 뛰어넘는다” 中 AI 모델 Kimi K2 무료 공개

중국에 본사를 둔 AI 개발기업 문샷AI(Moonshot AI)가 대규모 언어모델 Kimi K2를 7월 12일 출시했다. Kimi K2는 DeepSeek-V3나 Qwen3-235B 같은 오픈 모델을 뛰어넘는 성능을 갖추고 있으며 다수 테스트에서 GPT-4.1이나 클로드 소넷 4 등 상용 모델 점수를 상회하고 있다.

Kimi K2는 매개변수 수 1조 개, 활성 매개변수 수 320억 개를 지원하는 AI 모델로 다수 전문가 모델을 조합해 대규모 모델 하나를 구축하는 MoE(Mixture of Experts) 아키텍처를 채택했다. Kimi K2는 오픈AI o시리즈와 같은 추론 모델은 아니지만 에이전트 태스크에 최적화해 단순한 응답 뿐 아니라 도구 사용 등도 가능하게 됐다고 한다. 또 수학 태스크나 코딩 태스크에서도 높은 성능을 발휘한다.

Kimi K2는 기반 모델인 Kimi-K2-Base와 사후학습 완료 모델인 Kimi-K2-Instruct 2종류로 나뉘어 출시됐다. Kimi-K2-Instruct는 모든 테스트에서 오픈 모델인 DeepSeek V3와 Qwen3-235B를 뛰어넘는 점수를 기록했으며 일부 테스트에서는 GPT-4.1이나 클로드 소넷 4 등 상용 모델을 이겼다.

Kimi K2의 AI 에이전트로서의 성능을 보여주는 사용 예시를 보면 여행 계획을 세우도록 지시하면 날짜 취득, 웹상 정보 검색, 메일 받은편지함 확인 등과 같이 각종 도구를 활용하면서 계획을 세워준다. 최종적으로 시각적으로 알기 쉬운 계획서가 출력된다.

@Kimi_Moonshot k2 just oneshotted this game with the prompt "create a simple breakout game as a single html page", cost less than a penny on @OpenRouterAI pic.twitter.com/DZRB1VZpYk
— waterdoggie (@waterdoggie) July 12, 2025

https://platform.twitter.com/widgets.js

또 Kimi K2를 실제로 사용한 사용자로부터는 HTML 파일 하나로 간단한 블록 깨기 게임을 작성(create a simple breakout game as a single html page)이라는 프롬프트를 입력하는 것만으로 지시대로 게임을 한 번에 만들 수 있었다는 보고가 접수되고 있다.

Kimi K2는 API를 통해 이용 가능하며 허깅페이스에서 Kimi-K2-Base와 Kimi-K2-Instruct의 모델 데이터가 배포되고 있다. 또 Kimi K2 관련 코드도 공개되고 있다.