← Về danh sách bài viết

So sánh các nguồn giọng (chuẩn Việt) để làm giọng thầy cúng, thầy phong thủy

Sau 1 thời gian kiểm tra và test thử, dưới đây là các TTS tiếng Việt mã nguồn mở mà bạn có thể tham khảo và sử dụng 👇


🔥 1. VieNeu-TTS (mạnh nhất hiện tại, đáng test ngay)

👉 https://github.com/pnnbao97/VieNeu-TTS

🧠 Bản chất

  • Model TTS tiếng Việt mới (2026)

  • Có:

    • voice cloning

    • chạy local CPU/GPU

    • hỗ trợ EN + VI

⚡ Ưu điểm

  • Chạy offline hoàn toàn

  • Turbo mode chạy CPU

  • Clone giọng chỉ cần vài giây audio

  • Có UI web sẵn

❌ Nhược điểm

  • Mode nhanh (Turbo) → giảm chất lượng

  • Model còn mới → chưa ổn định production

👉 Note:

Có thể chạy realtime CPU + bilingual + clone giọng (GitHub)

👉 Đánh giá:

⭐⭐⭐⭐⭐ (best open-source hiện tại)


⚡ 2. VietTTS (classic, dễ dùng)

👉 https://github.com/NTT123/vietTTS

🧠 Bản chất

  • Pipeline chuẩn:

    • duration model

    • acoustic model

    • HiFiGAN vocoder (GitHub)

✅ Ưu điểm

  • Code rõ ràng → dễ hiểu

  • Có pretrained model

  • Phù hợp research / demo

❌ Nhược điểm

  • ❌ Không update nữa

  • ❌ Giọng khá “robot”

  • ❌ Không có voice cloning

👉 Đánh giá:

⭐⭐⭐☆☆ (học thì tốt, prod thì không)


🧠 3. Viet-TTS (dangvansam – có cloning)

👉 https://github.com/dangvansam/viet-tts

🧠 Bản chất

  • Toolkit TTS + voice cloning

  • API compatible kiểu OpenAI

✅ Ưu điểm

  • Có thể:

    • generate giọng từ audio sample

    • tích hợp API dễ

  • Dùng tốt cho experiment

❌ Nhược điểm

  • Chưa phổ biến rộng

  • Chất lượng phụ thuộc dataset

👉 Note:

hỗ trợ voice cloning và TTS linh hoạt (Hugging Face)

👉 Đánh giá:

⭐⭐⭐⭐☆ (tiềm năng tốt)


🔬 4. VITS Vietnamese (finetune)

👉 https://github.com/phatjkk/vits-tts-vietnamese

🧠 Bản chất

  • Finetune từ VITS (state-of-the-art TTS)

  • Deploy dạng microservice (ONNX) (GitHub)

✅ Ưu điểm

  • Chất lượng cao hơn VietTTS

  • Có thể scale production

  • Nhẹ (ONNX)

❌ Nhược điểm

  • Phải:

    • train / finetune

    • chuẩn bị dataset

  • Không plug-and-play

👉 Đánh giá:

⭐⭐⭐⭐☆ (best nếu bạn biết train model)


🧪 5. viXTTS (clone giọng kiểu ElevenLabs)

👉 https://github.com/thinhlpg/vixtts-demo

🧠 Bản chất

  • Finetune từ XTTS (multi-language TTS)

  • Focus: voice cloning

✅ Ưu điểm

  • Clone giọng khá tốt

  • Multi-language

  • Demo nhanh

❌ Nhược điểm

  • Repo demo → chưa production-ready

  • Phụ thuộc model upstream

👉 Đánh giá:

⭐⭐⭐⭐☆ (demo AI rất ổn)


🚀 6. F5-TTS Vietnamese (đúng cái bạn đang hỏi)

👉 https://github.com/nguyenthienhy/F5-TTS-Vietnamese

🧠 Bản chất

  • Pipeline fine-tune F5-TTS sang tiếng Việt

✅ Ưu điểm

  • Giữ được kiến trúc F5

  • Có demo HuggingFace

❌ Nhược điểm

  • Không phải model chính thức

  • Chất lượng phụ thuộc data

  • Setup phức tạp

👉 Note:

là pipeline train lại model F5 cho tiếng Việt (GitHub)

👉 Đánh giá:

⭐⭐⭐☆☆ (chỉ nên dùng nếu bạn fix F5)


🧭 So sánh nhanh

Model Dễ dùng Chất lượng Clone giọng Production
VieNeu-TTS ⭐⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐
VietTTS ⭐⭐⭐⭐ ⭐⭐
Viet-TTS (dangvansam) ⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐
VITS finetune ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐
viXTTS ⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐
F5-VN ⭐⭐⭐ ⭐⭐

🔥 Gợi ý thực tế cho bạn (quan trọng)

Nếu bạn đang thay F5-TTS:

👉 Option tốt nhất:

VieNeu-TTS → test nhanh
+
VITS finetune → production

👉 Nếu muốn giống ElevenLabs:

XTTS / viXTTS + dataset riêng

⚠️ Một vấn đề cực quan trọng (dev hay bỏ qua)

Tiếng Việt cần:

  • tone (dấu)

  • text normalization

👉 nên dùng thêm:

  • VietNormalizer (normalize số, ngày tháng trước khi TTS)


🚀 Kết luận

  • Test nhanh: VieNeu-TTS

  • Làm product thật: VITS finetune

  • Clone giọng: viXTTS / Viet-TTS

  • Fix F5: chỉ dùng repo F5-Vietnamese


Bài viết này được hỗ trợ bởi AI và biên tập bởi Thầy Linh. Mọi nội dung đã qua kiểm chứng nguồn trước khi xuất bản.

N
Tác giả

Nguyễn Mạnh Linh

Xem hồ sơ · Đặt lịch tư vấn →

Bài viết liên quan