x

이메일로 만나보는 스타트업 가이드

투자, 행사, 정부사업 등 스타트업 생태계 소식을 이메일로 편하게 받아보세요.

알리바바 AI 연구팀 Qwen(Tongyi Lab)이 AI 모델 Qwen3.5 시리즈를 2월 16일 발표하고 시리즈 첫 번째 제품으로 오픈 모델 Qwen3.5-397B-A17B를 공개했다. Qwen3.5-397B-A17B는 GPT-5.2, 클로드 오푸스 4.5, 제미나이 3 프로 등 클로즈드 모델과 동등한 성능을 보이고 있다.

Qwen3.5-397B-A17B는 수조 토큰에 달하는 방대한 학습 데이터로 훈련된 AI 모델로 총 파라미터 수는 3,970억 개, 활성 파라미터 수는 170억 개다. 대규모 언어 모델과 비전 언어 모델의 기능을 통합했으며 코딩 성능과 에이전트 성능 뿐 아니라 이미지·영상 이해 성능에서도 뛰어난 특징을 보인다.

Qwen3.5-397B-A17B는 강화학습을 진행할수록 성능이 향상된 것으로 알려졌다. 완성된 Qwen3.5-397B-A17B는 사고 과정 없이 처리하는 방식에서 DeepSeek-V3.2-Thinking을 능가하는 성능을 보였으며 사고 과정을 포함한 처리에서는 GPT-5.2 High, 제미나이 3 프로, 클로드 오푸스 4.5 등 클로즈드 모델을 상회했다.

코딩 성능과 시각 이해 성능 등을 측정하는 각종 벤치마크 결과 일부 테스트에서는 Qwen3-VL-235B-A22B가 최고 점수를 기록했다.

 

Qwen3-VL-235B-A22B는 기존 Qwen 시리즈와 비교해 처리 효율이 향상됐으며 Qwen3-Max 대비 32K 토큰에서는 8.6배, 256K 토큰에서는 19배 빠른 처리가 가능하다. Qwen3-VL-235B-A22B로 웹사이트를 코딩하는 모습을 담은 영상도 공개되어 고품질 웹사이트를 제작할 수 있음을 보여주고 있다. 또 3D CG를 활용한 레이싱 게임 개발도 가능하다.

 

Qwen3-VL-235B-A22B 모델 데이터는 링크를 통해 확인할 수 있다. 아울러 Qwen Chat에서는 Qwen3-VL-235B-A22B 외에 100만 토큰 입력을 지원하는 Qwen3.5-Plus도 사용할 수 있다. Qwen3.5-Plus는 Alibaba Cloud Model Studio의 API를 통해서도 이용 가능하다. 관련 내용은 이곳에서 볼 수 있다.

뉴스 레터 구독하기

Related Posts

No Content Available
Next Post