IndexTTS
IndexTTS adalah sistem text-to-speech kelas industri oleh Bilibili yang memberikan sintesis suara berkualitas tinggi dengan kloning suara zero-shot, dukungan multibahasa, dan kemampuan kontrol emosi.
Panduan Input Teks untuk IndexTTS
Pelajari cara membuat input teks yang efektif untuk hasil sintesis suara yang optimal
Elemen Penting
Struktur Teks yang Jelas
Gunakan tanda baca yang tepat untuk mengontrol jeda dan ritme dalam ucapan yang dihasilkan
Petunjuk Pelafalan
Untuk teks Mandarin, gunakan notasi pinyin untuk mengoreksi karakter polifonik
Tag Emosi
Tentukan nada emosional untuk membuat ucapan lebih ekspresif dan alami
Pencampuran Bahasa
Campur Mandarin dan Inggris dengan mulus dalam input teks Anda
Tips Pro untuk Hasil yang Lebih Baik
Gunakan Tanda Baca Alami
Tambahkan koma, titik, dan tanda seru secara alami untuk mengontrol ritme dan jeda ucapan
Audio Referensi Berkualitas
Untuk kloning suara, gunakan audio referensi yang jelas dengan kebisingan latar minimal (5-10 detik optimal)
Pecah Teks Panjang
Bagi teks yang sangat panjang menjadi potongan-potongan yang lebih kecil untuk kualitas yang lebih konsisten dan pemrosesan yang lebih mudah
Uji Pelafalan
Untuk teks Mandarin dengan karakter langka, uji pelafalan dan tambahkan koreksi pinyin jika diperlukan
Input Dasar vs Ditingkatkan
"今天天气很好 (Cuaca hari ini sangat bagus)"
"今天天气很好,让我们出去走走吧!(Cuaca hari ini sangat bagus, ayo kita jalan-jalan!)"
"I have great news to share (Saya punya kabar baik untuk dibagikan)"
"[Excited] I have great news to share with everyone! ([Senang] Saya punya kabar baik untuk dibagikan kepada semua orang!)"
Cara Menggunakan IndexTTS
Ikuti langkah-langkah sederhana ini untuk menghasilkan ucapan berkualitas tinggi dari teks Anda
Siapkan Teks Anda
Masukkan atau tempel teks yang ingin Anda konversi menjadi ucapan. Gunakan tanda baca yang tepat dan tambahkan petunjuk pelafalan jika diperlukan.
Unggah Audio Referensi (Opsional)
Untuk kloning suara, unggah sampel audio yang jelas selama 5-10 detik dari suara target. Lewati langkah ini untuk menggunakan suara default.
Pilih Bahasa & Emosi
Pilih bahasa utama Anda (Mandarin/Inggris) dan pilih tag emosi jika Anda menginginkan ucapan yang ekspresif.
Hasilkan & Unduh
Klik hasilkan untuk membuat audio Anda. Pratinjau hasilnya dan unduh file audio saat puas.
Tips Cepat
- •Audio referensi harus jelas dengan kebisingan latar minimal untuk hasil kloning suara terbaik
- •Teks yang lebih panjang mungkin membutuhkan lebih banyak waktu untuk diproses - pertimbangkan untuk membaginya menjadi segmen yang lebih kecil
- •Bereksperimenlah dengan pola tanda baca yang berbeda untuk mencapai ritme ucapan yang Anda inginkan
- •Untuk teks Mandarin, koreksi pinyin dapat secara signifikan meningkatkan akurasi pelafalan
Kualitas ucapan yang dihasilkan bergantung pada kejelasan teks input dan kualitas audio referensi (untuk kloning suara). Untuk hasil terbaik, gunakan teks yang diformat dengan baik dengan tanda baca alami.
Pertanyaan yang Sering Diajukan
Temukan jawaban untuk pertanyaan umum tentang IndexTTS
Siap Membuat Ucapan Alami?
Mulai gunakan IndexTTS hari ini untuk mengubah teks Anda menjadi ucapan berkualitas tinggi dan terdengar alami dengan kemampuan kloning suara canggih
IndexTTS dilatih pada 25.000 jam audio Mandarin dan 9.000 jam audio Inggris, memastikan kualitas kelas profesional untuk proyek Anda