김과장
AI 뉴스 목록
2026-03-20AI 음성오픈소스KittenTTSTTS무료 도구

내 컴퓨터에서 25MB짜리 AI가 사람처럼 말한다 — GPU 없이 돌아가는 무료 음성 AI KittenTTS

25MB짜리 초소형 AI 음성 모델 KittenTTS가 깃허브 스타 1만 1천을 넘었습니다. GPU 없이 일반 컴퓨터 CPU만으로 8가지 목소리를 합성하며, pip 한 줄이면 설치 완료입니다.


AI에게 글을 읽어달라고 시키려면 보통 클라우드 서비스에 돈을 내거나, 수십 GB짜리 모델을 고성능 GPU에 올려야 했습니다. KittenTTS는 이 공식을 완전히 뒤집었습니다. 가장 작은 모델이 25MB — 사진 몇 장 크기에 불과한데, GPU 없이 일반 컴퓨터의 CPU만으로 사람과 비슷한 음성을 만들어냅니다.

KittenTTS 로고 — State-of-the-art TTS model under 25MB

사진 몇 장 크기로 8가지 목소리를 만든다

KittenTTS는 ONNX(다양한 기기에서 AI 모델을 실행할 수 있게 해주는 표준 형식) 위에 구축된 오픈소스 음성 합성 라이브러리입니다. 모델은 용도에 따라 4가지 크기로 제공됩니다.

모델 라인업

nano (int8) — 15M 파라미터, 25MB. 스마트폰이나 라즈베리파이에서도 돌아갈 정도로 가벼움
nano (fp32) — 15M 파라미터, 56MB. nano의 고정밀 버전
micro — 40M 파라미터, 41MB. 음질과 크기의 균형
mini — 80M 파라미터, 80MB. 가장 높은 음질, HuggingFace에서 26만 9천 회 다운로드

8가지 내장 목소리(Bella, Jasper, Luna, Bruno, Rosie, Hugo, Kiki, Leo)를 제공하고, 말하는 속도도 자유롭게 조절할 수 있습니다. 숫자, 통화 기호, 단위 등을 자동으로 읽어주는 전처리 기능까지 내장되어 있어서, "$1,250"을 넣으면 알아서 "one thousand two hundred fifty dollars"로 읽어줍니다.

pip 한 줄이면 끝 — 5분 안에 첫 음성 생성

설치와 사용이 놀라울 정도로 간단합니다. Python 3.8 이상이 설치된 컴퓨터라면 운영체제(Windows, Mac, Linux)를 가리지 않습니다.

# 설치
pip install https://github.com/KittenML/KittenTTS/releases/download/0.8.1/kittentts-0.8.1-py3-none-any.whl

# 음성 생성
from kittentts import KittenTTS

model = KittenTTS("KittenML/kitten-tts-mini-0.8")
audio = model.generate("Hello, this runs without a GPU.", voice="Jasper")

import soundfile as sf
sf.write("output.wav", audio, 24000)

모델은 HuggingFace Hub에서 자동으로 다운로드되므로 별도 설정이 필요 없습니다. 24kHz 샘플레이트의 고품질 오디오가 WAV 파일로 저장됩니다.

속도 조절도 한 줄입니다.

# 1.2배속으로 빠르게
audio = model.generate("Hello, world.", voice="Luna", speed=1.2)

# 0.9배속으로 천천히, 바로 파일 저장
model.generate_to_file("Hello, world.", "output.wav", voice="Bruno", speed=0.9)

누가 쓰면 좋을까

콘텐츠 크리에이터 — 유튜브 나레이션, 팟캐스트 인트로, 오디오북 초안을 클라우드 비용 없이 내 컴퓨터에서 만들 수 있습니다.

개발자 — IoT 기기, 키오스크, 로봇 등 인터넷 연결이 불안정한 환경에서 25MB짜리 모델로 음성 안내를 구현할 수 있습니다.

교육·접근성 — 시각장애인을 위한 텍스트 읽기, 언어 학습용 발음 생성에 무료로 활용할 수 있습니다.

기존 음성 AI와 뭐가 다른가

이미 무료 음성 복제 도구인 Chatterbox 같은 프로젝트가 있지만, KittenTTS는 방향이 다릅니다. Chatterbox가 "내 목소리를 복제하는" 데 초점을 맞춘다면, KittenTTS는 "얼마나 작은 모델로 쓸 만한 품질을 낼 수 있는가"에 도전합니다.

25MB라는 크기는 OpenAI TTS나 ElevenLabs 같은 클라우드 서비스와는 비교 자체가 다른 카테고리입니다. 클라우드 서비스는 월 수십 달러를 내야 하지만, KittenTTS는 완전 무료이고 데이터가 내 컴퓨터 밖으로 나가지 않습니다.

아직 초기 단계 — 알아둘 점

현재 영어만 지원하며, 다국어 지원은 로드맵에 있습니다. "Developer Preview" 단계라 API가 바뀔 수 있고, nano int8 모델에서 일부 사용자가 문제를 보고하고 있습니다. 그러나 깃허브 스타 1만 1천, HuggingFace 다운로드 26만 9천이라는 숫자는 커뮤니티가 이 프로젝트에 거는 기대를 보여줍니다.

직접 들어보고 싶다면 브라우저에서 바로 테스트할 수 있는 HuggingFace 데모가 마련되어 있습니다. Apache 2.0 라이선스이므로 상업적 사용도 가능합니다.

관련 콘텐츠Easy클코로 AI 시작하기 | 무료 학습 가이드 | AI 뉴스 더보기

AI 소식, 가장 빠르고 쉽게 받아보세요

누구나 이해할 수 있도록, 가장 자세하고 쉽게 알려드립니다

텔레그램 채널 구독