x

이메일로 만나보는 스타트업 가이드

투자, 행사, 정부사업 등 스타트업 생태계 소식을 이메일로 편하게 받아보세요.

이미지 생성 AI 스테이블 디퓨전 개발사로 알려진 AI 기업 스태빌리티AI(Stability AI)가 음악 생성 AI 스테이블 오디오 3.0(Stable Audio 3.0)을 공개했다.

스테이블 오디오 3.0은 스테이블 오디오 3.0 스몰(Stable Audio 3.0 Small), 스테이블 오디오 3.0 스몰 SFX(Stable Audio 3.0 Small SFX), 스테이블 오디오 3.0 미디엄(Stable Audio 3.0 Medium), 스테이블 오디오 3.0 라지(Stable Audio 3.0 Large) 4종으로 나뉘어 출시됐으며 이 가운데 스테이블 오디오 3.0 스몰, 스테이블 오디오 3.0 스몰 SFX, 스테이블 오디오 3.0 미디엄 3종은 오픈 모델로 무료 공개됐다.

모델별 특징을 보면 스테이블 오디오 3.0 스몰은 최대 2분 분량 음악 생성이 가능하고 스마트폰이나 노트북에서도 동작하는 소형 모델이며 짧은 트랙 생성에 최적화되어 있다. 스테이블 오디오 3.0 스몰 SFX는 최대 2분 분량 음악 생성이 가능하며 스마트폰이나 노트북에서도 동작하는 소형 모델. 사운드 이펙트 등 생성에 최적화된다. 스테이블 오디오 3.0 미디엄은 최대 6분 20초 분량 음악 생성이 가능하며 고도의 음악 표현이 가능하다. 스테이블 오디오 3.0 라지는 최대 6분 20초 분량 음악 생성이 가능하며 시리즈 가운데 최고 성능 모델이다.

 

스테이블 오디오 3.0은 기존 악곡 편집이나 기존 악곡 이어서 생성 같은 작업도 지원한다. LoRA를 이용해 원하는 스타일로 조정하는 것도 가능하다.

또 생성형 AI 도구 ComfyUI가 스테이블 오디오 3.0을 이용한 음악 생성 기능을 공개 당일 지원했다. 스테이블 오디오 3.0 라지는 스태빌리티AI API를 통해 이용할 수 있으며 기업용 모델 제공도 이뤄지고 있다. 관련 내용은 이곳에서 확인할 수 있다.

뉴스 레터 구독하기

Related Posts

No Content Available
Next Post