x

이메일로 만나보는 스타트업 가이드

투자, 행사, 정부사업 등 스타트업 생태계 소식을 이메일로 편하게 받아보세요.

중국 IT 기업 알리바바 AI 개발팀이 이미지 생성 AI Qwen-Image를 기반으로 이미지 편집 작업을 확장해 캐릭터 원래 모습을 유지한 채 다른 상황을 그려낼 수 있는 Qwen-Image-Edit를 발표했다.

알리바바 AI 개발팀은 대규모 언어 모델 Qwen 시리즈와 이미지 생성 AI Qwen VLo를 선보여 왔다. 8월 4일에는 오픈AI 등 기존 이미지 생성 AI가 취약한 정확한 텍스트 묘사도 해내는 Qwen-Image를 발표했다.

Qwen-Image-Edit는 Qwen-Image를 기반으로 이미지 편집 작업을 확장한 것으로 주로 시맨틱 편집 및 외관 편집, 정확한 텍스트 편집, 강력한 벤치마크 성능 등 3가지 특징을 가지고 있다.

시맨틱 편집이란 입력된 이미지 모습을 손상시키지 않고 상황을 편집하는 기능으로 Qwen 마스코트 캐릭터인 카피바라를 사용한 예시가 공개됐다.

Qwen-Image-Edit는 또 객체 90도 회전 뿐 아니라 180도 회전도 가능하다. 의상이나 헤어스타일 파손 없이 회전할 수 있는 건 물론이다. 포트레이트를 입력해 다양한 스타일로 변경하는 것도 가능하며 외관 편집에서는 특정 요소 추가·삭제·수정을 할 수 있다.

https://platform.twitter.com/widgets.js

다른 이미지 생성 AI가 취약한 텍스트 처리도 잘하며 문자열 내용을 바꿔도 파손되지 않는다. 세로쓰기의 붓글씨풍 이미지에서도 수정 부분을 지정해 편집이 가능하다. 더 나아가 액자에 넣어 방에 장식하는 편집도 가능하다.

Qwen팀은 Qwen-Image-Edit가 이미지 생성 분야를 더 발전시키고 비주얼 콘텐츠 생성에 대한 기술적 장벽을 낮춰 더 혁신적인 애플리케이션을 자극하기를 바란다고 밝혔다. 모델 데이터는 허깅페이스에서 공개되고 있다. 관련 내용은 이곳에서 확인할 수 있다.

뉴스 레터 구독하기

Related Posts

No Content Available
Next Post