x

이메일로 만나보는 스타트업 가이드

투자, 행사, 정부사업 등 스타트업 생태계 소식을 이메일로 편하게 받아보세요.

알리바바 AI 개발팀인 Qwen이 화상생성AI Qwen-Image를 8월 4일 발표했다. Qwen-Image는 기존 화상생성AI가 취약한 텍스트의 정확한 묘화를 특기로 하며 복수행에 걸친 중국어 문장을 포함한 이미지나 영어와 중국어 모두를 포함한 이미지를 정확히 묘화할 수 있다. 또 일반 이미지 생성이나 이미지 편집도 고품질임을 어필하고 있다.

Qwen-Image는 이미지 표현과 텍스트 표현에 별도 가중치를 사용하는 멀티모달 확산 변환기(MMDiT)라 불리는 기술을 기반으로 개발된 화상생성AI로 높은 텍스트 묘화 성능을 갖춘 게 특징이다.

Qwen-Image는 이미지 내 텍스트 위치를 세밀하게 지정하는 것도 가능하며 슬라이드풍 이미지를 생성할 수도 있다. Qwen-Image는 또 중국어 묘화 성능에서 최고 점수를 보였으며 영어 묘화 성능에서도 일부 테스트에서 GPT Image 1을 뛰어넘는 성능을 보였다.

Qwen-Image는 일반적인 이미지 생성 성능 높이도 어필되고 있으며 실사풍 이미지나 일러스트풍 이미지, 수묵화풍 이미지 등이 작례로 공개되고 있다.

또 캐릭터 포즈를 변경하는 것, 캐릭터를 유지하면서 이미지 스타일을 변경하는 것, 이미지에 오브젝트를 추가하는 것 같은 편집 태스크도 고품질로 해낼 수 있다.

Qwen-Image 모델 데이터는 허깅페이스에서 공개되고 있다. 관련 내용은 이곳에서 확인할 수 있다.

뉴스 레터 구독하기

Related Posts

No Content Available
Next Post