
알리바바 AI 개발팀인 Qwen이 화상생성AI Qwen-Image를 8월 4일 발표했다. Qwen-Image는 기존 화상생성AI가 취약한 텍스트의 정확한 묘화를 특기로 하며 복수행에 걸친 중국어 문장을 포함한 이미지나 영어와 중국어 모두를 포함한 이미지를 정확히 묘화할 수 있다. 또 일반 이미지 생성이나 이미지 편집도 고품질임을 어필하고 있다.
Qwen-Image는 이미지 표현과 텍스트 표현에 별도 가중치를 사용하는 멀티모달 확산 변환기(MMDiT)라 불리는 기술을 기반으로 개발된 화상생성AI로 높은 텍스트 묘화 성능을 갖춘 게 특징이다.
Qwen-Image는 이미지 내 텍스트 위치를 세밀하게 지정하는 것도 가능하며 슬라이드풍 이미지를 생성할 수도 있다. Qwen-Image는 또 중국어 묘화 성능에서 최고 점수를 보였으며 영어 묘화 성능에서도 일부 테스트에서 GPT Image 1을 뛰어넘는 성능을 보였다.
Qwen-Image는 일반적인 이미지 생성 성능 높이도 어필되고 있으며 실사풍 이미지나 일러스트풍 이미지, 수묵화풍 이미지 등이 작례로 공개되고 있다.
또 캐릭터 포즈를 변경하는 것, 캐릭터를 유지하면서 이미지 스타일을 변경하는 것, 이미지에 오브젝트를 추가하는 것 같은 편집 태스크도 고품질로 해낼 수 있다.
Qwen-Image 모델 데이터는 허깅페이스에서 공개되고 있다. 관련 내용은 이곳에서 확인할 수 있다.
![[AI서머리] 창업기업 위한 법률상담회, 청주 개최‧소이넷, ‘다바르 하이브리드’ 론칭](https://startuprecipe.co.kr/wp-content/uploads/2025/08/250808_apoc.day_00346-75x75.jpg)

