LTX 2.3 무료 오픈소스 — 4K AI 영상+오디오 동시 생성 모델
Lightricks LTX 2.3은 텍스트만 입력하면 4K 영상과 효과음을 동시에 만드는 오픈소스 AI입니다. 내 PC에서 무료 설치 가능하고, 세로 영상(숏츠·릴스)도 네이티브 지원합니다. 설치법과 활용법을 정리했습니다.
AI 영상 생성의 새 기준 — 글자 몇 줄 입력하면 4K 영상이 소리와 함께 만들어집니다. 이스라엘 AI 회사 Lightricks가 공개한 LTX 2.3은 영상과 음향을 하나의 모델 안에서 동시에 생성하는 오픈소스 AI입니다. 한 달 동안 79만 6천 건이 다운로드됐고, 내 컴퓨터에 직접 설치해서 무료로 쓸 수 있습니다. Sora, Kling 같은 유료 도구 없이도 고품질 AI 영상 제작이 가능해진 셈입니다.

LTX 2.3이 기존 AI 영상 도구와 다른 점
지금까지 AI 영상 도구들은 대부분 영상과 소리를 따로 만들어야 했습니다. 영상을 먼저 생성하고, 별도 도구로 배경음악이나 효과음을 입히는 식이었습니다. LTX 2.3은 이 과정을 하나로 합쳤습니다.
- 해상도: 1080p, 1440p, 4K까지 지원
- 프레임: 24/25/48/50 fps — 영화급 부드러움
- 길이: 최대 20초 (업스케일러로 연장 가능)
- 오디오: 영상과 동시에 생성, 입 모양·발소리까지 자동 동기화
- 세로 영상: 9:16 비율 네이티브 지원 — 릴스·숏츠용
- 모델 크기: 220억 파라미터 (영상 140억 + 오디오 50억)
특히 세로 영상(9:16)을 네이티브로 지원하는 점이 눈에 띕니다. 대부분의 AI 영상 도구가 가로 영상을 잘라서 세로로 바꾸는 반면, LTX 2.3은 처음부터 세로 비율 데이터로 훈련됐기 때문에 인스타그램 릴스나 유튜브 숏츠에 바로 쓸 수 있는 영상이 나옵니다.
2.3 버전에서 달라진 핵심 업그레이드
이전 버전(LTX 2.0)에서 가장 많이 지적받던 문제는 영상이 흐릿하고, AI가 지시를 잘 못 알아듣는 것이었습니다. 2.3에서는 세 가지 핵심 부품을 완전히 새로 만들었습니다.
1. 새로운 화질 엔진(VAE) — 더 고화질 데이터로 훈련해서 머리카락, 텍스트, 가장자리 같은 세밀한 부분이 뚜렷해졌습니다.
2. 4배 커진 텍스트 해석기 — "노을 지는 해변에서 데님 재킷 입은 소녀가 바람에 머리카락을 날리며 웃는 장면"처럼 복잡한 지시도 정확하게 따릅니다.
3. 새로운 음향 합성기(HiFi-GAN) — 이전에 음성이 뚝뚝 끊기거나 잡음이 섞이던 문제를 해결했습니다.

LTX 2.3 설치 및 사용 방법 4가지
LTX 2.3은 네 가지 방법으로 사용할 수 있습니다. 비개발자도 1단계 웹 데모부터 시작하면 됩니다.
1단계: 웹에서 바로 체험
가장 쉬운 방법입니다. 별도 설치 없이 브라우저에서 바로 써볼 수 있습니다.
2단계: 내 컴퓨터에 설치 (개발자용)
git clone https://github.com/Lightricks/LTX-2.git
cd LTX-2
uv sync --frozen
source .venv/bin/activate3단계: ComfyUI에서 사용 (디자이너·크리에이터용)
ComfyUI(AI 이미지·영상 생성을 시각적으로 조합하는 무료 도구) 최신 버전(v0.16)에 LTX 2.3이 기본 내장됐습니다. 별도 플러그인 설치 없이 바로 사용 가능합니다.
4단계: LoRA 커스터마이징
내가 원하는 스타일이나 캐릭터를 학습시킬 수 있습니다. 카메라 움직임, 포즈 감지, 모션 트래킹 등 전문 기능도 LoRA(소량 데이터로 AI를 빠르게 맞춤 학습시키는 기술)로 추가할 수 있으며, 학습에 1시간도 안 걸립니다.
비용과 라이선스 — 개인·스타트업은 무료
연 매출 1천만 달러(약 130억 원) 이하 기업은 무료로 사용할 수 있습니다. 개인 크리에이터, 스타트업, 소규모 스튜디오는 사실상 비용 걱정 없이 쓸 수 있다는 뜻입니다. 대형 기업이 제품에 내장하려면 별도 상용 라이선스가 필요합니다.
API를 통해 클라우드에서 사용할 수도 있는데, 생성 영상 초당 과금 방식이며 해상도에 따라 가격이 달라집니다.
Sora·Kling 등 경쟁 AI 영상 도구와 비교
Sora 2 Pro(OpenAI)와 Kling(쿠아이쇼우)이 현재 AI 영상 시장을 이끌고 있지만, 두 도구 모두 유료·클라우드 전용입니다. 내 컴퓨터에서 무료로 돌릴 수 없습니다. LTX 2.3은 오픈소스라서 인터넷 없이도, 데이터 유출 걱정 없이도 사용할 수 있습니다.
또한 영상+오디오 동시 생성은 오픈소스 모델 중 LTX가 유일합니다. Runway, Kling 같은 상용 도구도 오디오는 별도 과정이 필요한 경우가 많습니다.
한계와 주의할 점
물론 완벽하지는 않습니다. 영어 프롬프트에 최적화되어 있어 한국어 지시는 정확도가 떨어질 수 있고, 음성이 포함되지 않은 오디오(배경음, 효과음)의 품질이 상대적으로 낮습니다. 또한 20초 제한이 있어 긴 영상을 만들려면 여러 클립을 이어 붙여야 합니다.
하지만 한 달 79만 건 다운로드가 보여주듯, 무료로 이 수준의 품질을 얻을 수 있다는 점에서 크리에이터들의 열광적인 반응을 얻고 있습니다.
AI 영상 제작, 어디서부터 시작할까
LTX 2.3 같은 AI 영상 도구를 더 효과적으로 활용하려면 AI 자동화의 기본 개념을 먼저 이해하는 것이 좋습니다. AI로 숏츠 영상 자동 제작하는 방법을 참고하면 실전 워크플로를 빠르게 익힐 수 있습니다. 바이브코딩으로 나만의 영상 파이프라인을 만들고 싶다면 PPT·바이브코딩 가이드도 함께 확인해 보세요.
관련 콘텐츠 — Easy클코로 AI 시작하기 | 무료 학습 가이드 | AI 뉴스 더보기