Sau 1 thời gian kiểm tra và test thử, dưới đây là các TTS tiếng Việt mã nguồn mở mà bạn có thể tham khảo và sử dụng 👇
🔥 1. VieNeu-TTS (mạnh nhất hiện tại, đáng test ngay)
👉 https://github.com/pnnbao97/VieNeu-TTS
🧠 Bản chất
-
Model TTS tiếng Việt mới (2026)
-
Có:
-
voice cloning
-
chạy local CPU/GPU
-
hỗ trợ EN + VI
-
⚡ Ưu điểm
-
Chạy offline hoàn toàn
-
Có Turbo mode chạy CPU
-
Clone giọng chỉ cần vài giây audio
-
Có UI web sẵn
❌ Nhược điểm
-
Mode nhanh (Turbo) → giảm chất lượng
-
Model còn mới → chưa ổn định production
👉 Note:
Có thể chạy realtime CPU + bilingual + clone giọng (GitHub)
👉 Đánh giá:
⭐⭐⭐⭐⭐ (best open-source hiện tại)
⚡ 2. VietTTS (classic, dễ dùng)
👉 https://github.com/NTT123/vietTTS
🧠 Bản chất
-
Pipeline chuẩn:
-
duration model
-
acoustic model
-
HiFiGAN vocoder (GitHub)
-
✅ Ưu điểm
-
Code rõ ràng → dễ hiểu
-
Có pretrained model
-
Phù hợp research / demo
❌ Nhược điểm
-
❌ Không update nữa
-
❌ Giọng khá “robot”
-
❌ Không có voice cloning
👉 Đánh giá:
⭐⭐⭐☆☆ (học thì tốt, prod thì không)
🧠 3. Viet-TTS (dangvansam – có cloning)
👉 https://github.com/dangvansam/viet-tts
🧠 Bản chất
-
Toolkit TTS + voice cloning
-
API compatible kiểu OpenAI
✅ Ưu điểm
-
Có thể:
-
generate giọng từ audio sample
-
tích hợp API dễ
-
-
Dùng tốt cho experiment
❌ Nhược điểm
-
Chưa phổ biến rộng
-
Chất lượng phụ thuộc dataset
👉 Note:
hỗ trợ voice cloning và TTS linh hoạt (Hugging Face)
👉 Đánh giá:
⭐⭐⭐⭐☆ (tiềm năng tốt)
🔬 4. VITS Vietnamese (finetune)
👉 https://github.com/phatjkk/vits-tts-vietnamese
🧠 Bản chất
-
Finetune từ VITS (state-of-the-art TTS)
-
Deploy dạng microservice (ONNX) (GitHub)
✅ Ưu điểm
-
Chất lượng cao hơn VietTTS
-
Có thể scale production
-
Nhẹ (ONNX)
❌ Nhược điểm
-
Phải:
-
train / finetune
-
chuẩn bị dataset
-
-
Không plug-and-play
👉 Đánh giá:
⭐⭐⭐⭐☆ (best nếu bạn biết train model)
🧪 5. viXTTS (clone giọng kiểu ElevenLabs)
👉 https://github.com/thinhlpg/vixtts-demo
🧠 Bản chất
-
Finetune từ XTTS (multi-language TTS)
-
Focus: voice cloning
✅ Ưu điểm
-
Clone giọng khá tốt
-
Multi-language
-
Demo nhanh
❌ Nhược điểm
-
Repo demo → chưa production-ready
-
Phụ thuộc model upstream
👉 Đánh giá:
⭐⭐⭐⭐☆ (demo AI rất ổn)
🚀 6. F5-TTS Vietnamese (đúng cái bạn đang hỏi)
👉 https://github.com/nguyenthienhy/F5-TTS-Vietnamese
🧠 Bản chất
-
Pipeline fine-tune F5-TTS sang tiếng Việt
✅ Ưu điểm
-
Giữ được kiến trúc F5
-
Có demo HuggingFace
❌ Nhược điểm
-
Không phải model chính thức
-
Chất lượng phụ thuộc data
-
Setup phức tạp
👉 Note:
là pipeline train lại model F5 cho tiếng Việt (GitHub)
👉 Đánh giá:
⭐⭐⭐☆☆ (chỉ nên dùng nếu bạn fix F5)
🧭 So sánh nhanh
| Model | Dễ dùng | Chất lượng | Clone giọng | Production |
|---|---|---|---|---|
| VieNeu-TTS | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ✅ | ⭐⭐⭐ |
| VietTTS | ⭐⭐⭐⭐ | ⭐⭐ | ❌ | ⭐ |
| Viet-TTS (dangvansam) | ⭐⭐⭐ | ⭐⭐⭐⭐ | ✅ | ⭐⭐⭐ |
| VITS finetune | ⭐ | ⭐⭐⭐⭐⭐ | ✅ | ⭐⭐⭐⭐ |
| viXTTS | ⭐⭐⭐ | ⭐⭐⭐⭐ | ✅ | ⭐⭐ |
| F5-VN | ⭐ | ⭐⭐⭐ | ✅ | ⭐⭐ |
🔥 Gợi ý thực tế cho bạn (quan trọng)
Nếu bạn đang thay F5-TTS:
👉 Option tốt nhất:
VieNeu-TTS → test nhanh
+
VITS finetune → production
👉 Nếu muốn giống ElevenLabs:
XTTS / viXTTS + dataset riêng
⚠️ Một vấn đề cực quan trọng (dev hay bỏ qua)
Tiếng Việt cần:
-
tone (dấu)
-
text normalization
👉 nên dùng thêm:
-
VietNormalizer (normalize số, ngày tháng trước khi TTS)
🚀 Kết luận
-
Test nhanh: VieNeu-TTS
-
Làm product thật: VITS finetune
-
Clone giọng: viXTTS / Viet-TTS
-
Fix F5: chỉ dùng repo F5-Vietnamese
Bài viết này được hỗ trợ bởi AI và biên tập bởi Thầy Linh. Mọi nội dung đã qua kiểm chứng nguồn trước khi xuất bản.