x

이메일로 만나보는 스타트업 가이드

투자, 행사, 정부사업 등 스타트업 생태계 소식을 이메일로 편하게 받아보세요.

AI 기업 아이디어그램이 이미지 생성 AI인 아이디어그램 4.0(Ideogram 4.0)을 6월 3일 오픈 모델로 공개했다. 아이디어그램 4.0은 로컬에서 실행 가능한 오픈 모델임에도 제3자 기관 테스트에서 구글 나노 바나나 프로(Nano Banana Pro)를 능가하는 성능을 지닌 것으로 평가받았다.

아이디어그램 4.0은 93억 파라미터의 이미지 생성 모델로 사실적인 이미지와 일러스트풍 이미지를 모두 생성할 수 있다. 텍스트 렌더링 성능이 뛰어나 긴 문장도 정확하게 묘사할 수 있다.

또 학습 이미지 내 객체와 텍스트를 바운딩 박스(bounding box)로 영역을 구분해 모델이 객체와 텍스트 위치 관계를 이해하는 데 성공했다. 이를 통해 프롬프트로 레이아웃을 지시하기가 한층 수월해졌다.

디자인아레나(DesignArena)가 발표한 이미지 생성 AI 랭킹에서 아이디어그램 4.0은 나노 바나나 프로를 제치고 세계 4위를 기록했다. 디자인아레나는 AI 이름을 공개하지 않은 상태에서 생성물 품질을 인간이 평가하는 방식으로 랭킹을 산출하고 있으며 아이디어그램 4.0은 기계적 벤치마크가 아닌 인간 눈으로 고성능을 인정받은 셈이다. 오픈 모델만을 대상으로 한 랭킹에서는 아이디어그램 4.0이 2위 HunyuanImage-3.0, 3위 플럭스.2 [dev]와 큰 격차를 벌리며 1위를 차지했다. 아이디어그램 4.0은 오픈 모델 중 최고 수준 텍스트 렌더링 성능을 갖추면서도 파라미터 수는 비교적 작게 억제되어 있다.

무료로 사용할 수 있는 데모 앱도 제공되고 있다. 아이디어그램 4.0은 FP8 버전과 NF4 버전이 배포되고 있으며 NF4 버전은 VRAM 24GB GPU에서 한 번에 불러올 수 있는 크기로 제한되어 있다. 이미 컴피UI(ComfyUI)에서도 아이디어그램 4.0을 활용한 이미지 생성이 가능한 상태다.

소스 코드 및 관련 문서도 공개되어 있으며 아이디어그램은 커뮤니티를 통한 모델 개선에 기대를 나타내고 있다. 아울러 이미지 편집 모델도 공개할 계획이라고 밝혔다. 관련 내용은 이곳에서 확인할 수 있다.

뉴스 레터 구독하기

Related Posts

No Content Available
Next Post