x

이메일로 만나보는 스타트업 가이드

투자, 행사, 정부사업 등 스타트업 생태계 소식을 이메일로 편하게 받아보세요.

동영상 생성 AI 모델 LTX-2.3이 3월 6일 등장했다. LTX-2.3은 로컬에서 실행 가능한 오픈 모델로 공개됐으며 전 세대 모델인 LTX-2와 비교해 프롬프트 이해력 향상, 이미지에서 동영상을 생성할 때의 일관성 향상, 음성 품질 향상 등 기능 강화가 포함됐다. 또 윈도와 맥OS용 데스크톱 앱 엘티엑스 데스크톱도 공개됐다.

LTX-2 시리즈는 음성이 포함된 동영상을 생성할 수 있는 AI 모델로 로컬에서 동작하는 모델로서 알리바바 Wan 2.2와 함께 인기를 끌고 있다. 새롭게 등장한 LTX-2.3은 훈련 단계부터 이미지에서 동영상을 생성하는 처리(I2V)를 전제로 개발됐으며 여러 이미지를 입력해 이미지에서 이미지로 자연스럽게 이어지는 동영상을 생성하는 워크플로 정확도가 향상됐다.

 

또 텍스트 인코더 규모가 4배로 증가해 프롬프트 이해력이 향상됐고 카메라 워크와 구도, 캐릭터 동작 등 지시를 정확하게 반영할 수 있게 됐다. 아울러 VAE도 업데이트되어 묘사 정밀화와 움직임 안정화도 달성했다.

음성 품질도 향상되어 노이즈가 적은 명료하고 충실한 음성이 포함된 동영상을 생성할 수 있다.

LTX-2.3 발표와 동시에 LTX-2.3을 이용해 동영상을 생성할 수 있는 데스크톱 앱 LTX 데스크톱도 공개됐다. LTX 데스크톱은 윈도와 맥OS에 대응하며 윈도 버전에서는 LTX-2.3을 로컬에서 실행 가능하다. 맥OS 버전에서는 API를 통해 LTX-2.3을 실행한다. 윈도 버전의 경우 최소 요건으로 32GB 이상 VRAM, 32GB 이상 RAM, 60GB 이상 스토리지가 요구된다. 현재는 엔비디아 GPU에만 대응하고 있으며 AMD와 인텔에도 대응하기 위한 개발이 진행 중이다. 관련 내용은 이곳에서 확인할 수 있다.

뉴스 레터 구독하기

Related Posts

No Content Available
Next Post