내 컴퓨터에서 25MB짜리 AI가 사람처럼 말한다 — GPU 없이 돌아가는 무료 음성 AI KittenTTS
25MB짜리 초소형 AI 음성 모델 KittenTTS가 깃허브 스타 1만 1천을 넘었습니다. GPU 없이 일반 컴퓨터 CPU만으로 8가지 목소리를 합성하며, pip 한 줄이면 설치 완료입니다.
AI에게 글을 읽어달라고 시키려면 보통 클라우드 서비스에 돈을 내거나, 수십 GB짜리 모델을 고성능 GPU에 올려야 했습니다. KittenTTS는 이 공식을 완전히 뒤집었습니다. 가장 작은 모델이 25MB — 사진 몇 장 크기에 불과한데, GPU 없이 일반 컴퓨터의 CPU만으로 사람과 비슷한 음성을 만들어냅니다.
사진 몇 장 크기로 8가지 목소리를 만든다
KittenTTS는 ONNX(다양한 기기에서 AI 모델을 실행할 수 있게 해주는 표준 형식) 위에 구축된 오픈소스 음성 합성 라이브러리입니다. 모델은 용도에 따라 4가지 크기로 제공됩니다.
모델 라인업
• nano (int8) — 15M 파라미터, 25MB. 스마트폰이나 라즈베리파이에서도 돌아갈 정도로 가벼움
• nano (fp32) — 15M 파라미터, 56MB. nano의 고정밀 버전
• micro — 40M 파라미터, 41MB. 음질과 크기의 균형
• mini — 80M 파라미터, 80MB. 가장 높은 음질, HuggingFace에서 26만 9천 회 다운로드
8가지 내장 목소리(Bella, Jasper, Luna, Bruno, Rosie, Hugo, Kiki, Leo)를 제공하고, 말하는 속도도 자유롭게 조절할 수 있습니다. 숫자, 통화 기호, 단위 등을 자동으로 읽어주는 전처리 기능까지 내장되어 있어서, "$1,250"을 넣으면 알아서 "one thousand two hundred fifty dollars"로 읽어줍니다.
pip 한 줄이면 끝 — 5분 안에 첫 음성 생성
설치와 사용이 놀라울 정도로 간단합니다. Python 3.8 이상이 설치된 컴퓨터라면 운영체제(Windows, Mac, Linux)를 가리지 않습니다.
# 설치
pip install https://github.com/KittenML/KittenTTS/releases/download/0.8.1/kittentts-0.8.1-py3-none-any.whl
# 음성 생성
from kittentts import KittenTTS
model = KittenTTS("KittenML/kitten-tts-mini-0.8")
audio = model.generate("Hello, this runs without a GPU.", voice="Jasper")
import soundfile as sf
sf.write("output.wav", audio, 24000)
모델은 HuggingFace Hub에서 자동으로 다운로드되므로 별도 설정이 필요 없습니다. 24kHz 샘플레이트의 고품질 오디오가 WAV 파일로 저장됩니다.
속도 조절도 한 줄입니다.
# 1.2배속으로 빠르게
audio = model.generate("Hello, world.", voice="Luna", speed=1.2)
# 0.9배속으로 천천히, 바로 파일 저장
model.generate_to_file("Hello, world.", "output.wav", voice="Bruno", speed=0.9)
누가 쓰면 좋을까
콘텐츠 크리에이터 — 유튜브 나레이션, 팟캐스트 인트로, 오디오북 초안을 클라우드 비용 없이 내 컴퓨터에서 만들 수 있습니다.
개발자 — IoT 기기, 키오스크, 로봇 등 인터넷 연결이 불안정한 환경에서 25MB짜리 모델로 음성 안내를 구현할 수 있습니다.
교육·접근성 — 시각장애인을 위한 텍스트 읽기, 언어 학습용 발음 생성에 무료로 활용할 수 있습니다.
기존 음성 AI와 뭐가 다른가
이미 무료 음성 복제 도구인 Chatterbox 같은 프로젝트가 있지만, KittenTTS는 방향이 다릅니다. Chatterbox가 "내 목소리를 복제하는" 데 초점을 맞춘다면, KittenTTS는 "얼마나 작은 모델로 쓸 만한 품질을 낼 수 있는가"에 도전합니다.
25MB라는 크기는 OpenAI TTS나 ElevenLabs 같은 클라우드 서비스와는 비교 자체가 다른 카테고리입니다. 클라우드 서비스는 월 수십 달러를 내야 하지만, KittenTTS는 완전 무료이고 데이터가 내 컴퓨터 밖으로 나가지 않습니다.
아직 초기 단계 — 알아둘 점
현재 영어만 지원하며, 다국어 지원은 로드맵에 있습니다. "Developer Preview" 단계라 API가 바뀔 수 있고, nano int8 모델에서 일부 사용자가 문제를 보고하고 있습니다. 그러나 깃허브 스타 1만 1천, HuggingFace 다운로드 26만 9천이라는 숫자는 커뮤니티가 이 프로젝트에 거는 기대를 보여줍니다.
직접 들어보고 싶다면 브라우저에서 바로 테스트할 수 있는 HuggingFace 데모가 마련되어 있습니다. Apache 2.0 라이선스이므로 상업적 사용도 가능합니다.
관련 콘텐츠 — Easy클코로 AI 시작하기 | 무료 학습 가이드 | AI 뉴스 더보기
출처