x

이메일로 만나보는 스타트업 가이드

투자, 행사, 정부사업 등 스타트업 생태계 소식을 이메일로 편하게 받아보세요.

중국에 본사를 둔 AI 기업 Z.ai가 로컬에서 동작하는 경량 AI 모델인 GLM-4.7-Flash를 1월 19일 공개했다. GLM-4.7-Flash는 다수 벤치마크 테스트에서 오픈AI gpt-oss-20b를 상회하는 성능을 보이고 있다.

GLM-4.7-Flash는 복수 전문 모델을 결합하는 MoE 아키텍처를 채택한 AI 모델로 파라미터 수는 300억, 활성 파라미터 수는 30억이다.

GLM-4.7-Flash(총 파라미터 수: 300억, 활성 파라미터 수 30억), Qwen3-30B-A3B-Thinking-2507(총 파라미터 수: 300억, 활성 파라미터 수 30억), gpt-oss-20b(총 파라미터 수: 210억, 활성 파라미터 수 36억) 벤치마크 결과를 보면 대부분 테스트에서 GLM-4.7-Flash가 가장 높은 점수를 기록했다.

 

GLM-4.7-Flash는 오픈 모델로 개발되고 있으며 MIT 라이선스로 모델 데이터를 다운로드할 수 있다.

Z.ai가 공개한 BF16 버전 GLM-4.7-Flash를 구동하려면 45GB 이상 VRAM이 필요하다. Z.ai는 지포스 RTX 4090으로도 실행할 수 있냐는 질문에 대해 양자화 버전 출시를 기다리도록 안내하고 있다. 관련 내용은 이곳에서 확인할 수 있다.

뉴스 레터 구독하기

Related Posts

No Content Available
Next Post