
틱톡 운영사인 바이트댄스가 이미지 생성 AI인 시드림 4.0(Seedream 4.0)을 출시했다. 시드림 4.0은 최대 4K 해상도 이미지를 생성할 수 있으며, 단순한 텍스트에서 이미지 생성 뿐 아니라 모델 지식과 추론을 활용한 이미지 생성에도 대응한다. 고품질 이미지 편집 기능도 갖추고 있어 각종 벤치마크에서 구글이나 오픈AI 제품을 능가하는 점수를 기록했다.
시드림 4.0은 입력한 이미지 특징을 계승하면서 새로운 이미지를 생성하는 게 가능하다. 피사체 외모나 복장, 헤어스타일, 주변 풍경 등을 유지할 수 있다. 로고 이미지를 입력해서 여러 제품 이미지를 생성하는 것도 가능하다.
여러 이미지를 입력해서 각 요소를 이미지 1장으로 합치는 것도 가능하다. AI 모델 지식과 추론을 활용한 생성도 할 수 있다. 예를 들어 방정식만 제시해도 중간 과정과 해답을 추론해서 해당 내용을 이미지로 출력할 수 있다. 아이스크림 레시피를 영어로 써달라고 지시하기만 해도 세세한 단계를 출력해준다. 그 뿐 아니라 입력 이미지 대부분을 유지한 채 편집하는 것도 가능하다. 물론 문자 수정도 가능하며 흑백 사진을 컬러화하는 것도 가능하다. 애니메이션 풍으로 만들거나 아트 풍으로 만드는 등 이미지 전체 분위기를 변화시킬 수도 있다.
시드림 4.0을 제미나이 2.5, GPT 이미지 1, 시드림 3.0, Qwen-Image 이미지 생성 벤치마크 결과를 비교해보면 시드림 4.0은 모든 테스트에서 제미나이 2.5를 앞섰고 일부 테스트에서는 GPT 이미지 1을 넘어서는 점수를 보인다고 한다.
이미지 편집 성능 비교에서도 시드림 4.0은 많은 테스트에서 최고 점수를 기록했다. 시드림 4.0은 fal이나 ComfyUI 등 여러 플랫폼에서 이미 이용할 수 있다. 또 바이트댄스 프롬프트 가이드도 공개되어 있다. 관련 내용은 이곳에서 확인할 수 있다.


