
동영상 생성 AI 모델 LTX-2.3이 3월 6일 등장했다. LTX-2.3은 로컬에서 실행 가능한 오픈 모델로 공개됐으며 전 세대 모델인 LTX-2와 비교해 프롬프트 이해력 향상, 이미지에서 동영상을 생성할 때의 일관성 향상, 음성 품질 향상 등 기능 강화가 포함됐다. 또 윈도와 맥OS용 데스크톱 앱 엘티엑스 데스크톱도 공개됐다.
LTX-2 시리즈는 음성이 포함된 동영상을 생성할 수 있는 AI 모델로 로컬에서 동작하는 모델로서 알리바바 Wan 2.2와 함께 인기를 끌고 있다. 새롭게 등장한 LTX-2.3은 훈련 단계부터 이미지에서 동영상을 생성하는 처리(I2V)를 전제로 개발됐으며 여러 이미지를 입력해 이미지에서 이미지로 자연스럽게 이어지는 동영상을 생성하는 워크플로 정확도가 향상됐다.
Keyframes and structured control are now more deeply integrated.
LTX-2.3 is trained with multi-task objectives from the pretraining stage, including image-to-video, retake, keyframes, and more.
This makes transitions, controlled scene evolution, and multi-shot workflows more… pic.twitter.com/IXGoECapkq
— LTX-2 (@ltx_model) March 5, 2026
또 텍스트 인코더 규모가 4배로 증가해 프롬프트 이해력이 향상됐고 카메라 워크와 구도, 캐릭터 동작 등 지시를 정확하게 반영할 수 있게 됐다. 아울러 VAE도 업데이트되어 묘사 정밀화와 움직임 안정화도 달성했다.
음성 품질도 향상되어 노이즈가 적은 명료하고 충실한 음성이 포함된 동영상을 생성할 수 있다.
LTX-2.3 발표와 동시에 LTX-2.3을 이용해 동영상을 생성할 수 있는 데스크톱 앱 LTX 데스크톱도 공개됐다. LTX 데스크톱은 윈도와 맥OS에 대응하며 윈도 버전에서는 LTX-2.3을 로컬에서 실행 가능하다. 맥OS 버전에서는 API를 통해 LTX-2.3을 실행한다. 윈도 버전의 경우 최소 요건으로 32GB 이상 VRAM, 32GB 이상 RAM, 60GB 이상 스토리지가 요구된다. 현재는 엔비디아 GPU에만 대응하고 있으며 AMD와 인텔에도 대응하기 위한 개발이 진행 중이다. 관련 내용은 이곳에서 확인할 수 있다.
![[AI서머리] 중기부 특별성과 포상금 제도 본격 시행‧노무사랑, 고용노동부 지원사업 2년 연속 선정](https://startuprecipe.co.kr/wp-content/uploads/2026/03/260311_42Maru.Ai_50035235-75x75.jpg)
![[DailyRecipe] SBA와 오픈이노베이션 추진하는 대기업 12개사는?](https://startuprecipe.co.kr/wp-content/uploads/2026/03/20260310-SEOULOPENINNOVATIONDAY-1-350x250.jpg)
