x

이메일로 만나보는 스타트업 가이드

투자, 행사, 정부사업 등 스타트업 생태계 소식을 이메일로 편하게 받아보세요.

알리바바가 코딩 에이전트와 로컬 개발용으로 구축된 오픈 웨이트 언어 모델인 Qwen3-Coder-Next를 발표했다. 전체 파라미터 수는 80B(800억)로 추론 비용을 대폭 절감하면서도 강력한 코딩 능력과 에이전트 능력을 확보했다.

Qwen3-Coder-Next는 SWE-Bench Verified 테스트에서 70% 이상을 달성했으며 더 까다로운 SWE-Bench Pro에서는 비교 대상을 능가하는 성적을 보였다. Qwen3-Coder-Next는 대화 횟수를 늘려 SWE-Bench Pro에서 뛰어난 결과를 냈으며 알리바바는 이 모델이 멀티턴 에이전트 태스크에서의 장기 추론에 뛰어나다는 증거를 보여준다고 강조했다.

또 모델 전체 파라미터 수는 800억이며 활성 파라미터 수는 3억이다. 규모 대비 성능이 높다는 점에서 효율성과 성능 트레이드오프 개선을 실현했다고도 강조됐다.

 

Qwen3-Coder-Next는 Qwen3-Next-80B-A3B-Base를 기반으로 구축된 모델로 하이브리드 어텐션과 MoE라는 2가지 아키텍처를 채택한 신규 아키텍처를 구현했으며 대규모 실행 가능 태스크 합성, 환경 인터랙션, 강화학습에서 대규모 에이전트 트레이닝을 실시했다. 파라미터 스케일링에만 의존하지 않고 실제 코딩 에이전트에 필수적인 장기 추론, 툴 사용, 실패로부터의 복구를 중시해 설계했다고 밝혔다.

모델 데이터는 허깅페이스와 모델스코프에서 공개되고 있다. 관련 내용은 이곳에서 확인할 수 있다.

뉴스 레터 구독하기

Related Posts

No Content Available
Next Post