I

IndexTTS

IndexTTS adalah sistem text-to-speech kelas industri oleh Bilibili yang memberikan sintesis suara berkualitas tinggi dengan kloning suara zero-shot, dukungan multibahasa, dan kemampuan kontrol emosi.

Panduan Input Teks untuk IndexTTS

Pelajari cara membuat input teks yang efektif untuk hasil sintesis suara yang optimal

Elemen Penting

Struktur Teks yang Jelas

Gunakan tanda baca yang tepat untuk mengontrol jeda dan ritme dalam ucapan yang dihasilkan

Example: Halo, selamat datang di IndexTTS. Hari ini, kita akan menjelajahi teknologi kloning suara.

Petunjuk Pelafalan

Untuk teks Mandarin, gunakan notasi pinyin untuk mengoreksi karakter polifonik

Example: 重[chóng]要的事情说三[sān]遍 (Hal penting diucapkan tiga [sān] kali)

Tag Emosi

Tentukan nada emosional untuk membuat ucapan lebih ekspresif dan alami

Example: [Senang] Aku sangat senang untuk membagikan berita ini denganmu!

Pencampuran Bahasa

Campur Mandarin dan Inggris dengan mulus dalam input teks Anda

Example: 我今天学习了 machine learning 和 deep learning 的基础知识 (Hari ini saya mempelajari dasar-dasar machine learning dan deep learning)

Tips Pro untuk Hasil yang Lebih Baik

Gunakan Tanda Baca Alami

Tambahkan koma, titik, dan tanda seru secara alami untuk mengontrol ritme dan jeda ucapan

Audio Referensi Berkualitas

Untuk kloning suara, gunakan audio referensi yang jelas dengan kebisingan latar minimal (5-10 detik optimal)

Pecah Teks Panjang

Bagi teks yang sangat panjang menjadi potongan-potongan yang lebih kecil untuk kualitas yang lebih konsisten dan pemrosesan yang lebih mudah

Uji Pelafalan

Untuk teks Mandarin dengan karakter langka, uji pelafalan dan tambahkan koreksi pinyin jika diperlukan

Input Dasar vs Ditingkatkan

Input Dasar

"今天天气很好 (Cuaca hari ini sangat bagus)"

Input Ditingkatkan

"今天天气很好,让我们出去走走吧!(Cuaca hari ini sangat bagus, ayo kita jalan-jalan!)"

Input Dasar

"I have great news to share (Saya punya kabar baik untuk dibagikan)"

Input Ditingkatkan dengan Emosi

"[Excited] I have great news to share with everyone! ([Senang] Saya punya kabar baik untuk dibagikan kepada semua orang!)"

Cara Menggunakan IndexTTS

Ikuti langkah-langkah sederhana ini untuk menghasilkan ucapan berkualitas tinggi dari teks Anda

1

Siapkan Teks Anda

Masukkan atau tempel teks yang ingin Anda konversi menjadi ucapan. Gunakan tanda baca yang tepat dan tambahkan petunjuk pelafalan jika diperlukan.

2

Unggah Audio Referensi (Opsional)

Untuk kloning suara, unggah sampel audio yang jelas selama 5-10 detik dari suara target. Lewati langkah ini untuk menggunakan suara default.

3

Pilih Bahasa & Emosi

Pilih bahasa utama Anda (Mandarin/Inggris) dan pilih tag emosi jika Anda menginginkan ucapan yang ekspresif.

4

Hasilkan & Unduh

Klik hasilkan untuk membuat audio Anda. Pratinjau hasilnya dan unduh file audio saat puas.

Tips Cepat

  • Audio referensi harus jelas dengan kebisingan latar minimal untuk hasil kloning suara terbaik
  • Teks yang lebih panjang mungkin membutuhkan lebih banyak waktu untuk diproses - pertimbangkan untuk membaginya menjadi segmen yang lebih kecil
  • Bereksperimenlah dengan pola tanda baca yang berbeda untuk mencapai ritme ucapan yang Anda inginkan
  • Untuk teks Mandarin, koreksi pinyin dapat secara signifikan meningkatkan akurasi pelafalan

Kualitas ucapan yang dihasilkan bergantung pada kejelasan teks input dan kualitas audio referensi (untuk kloning suara). Untuk hasil terbaik, gunakan teks yang diformat dengan baik dengan tanda baca alami.

FAQ

Pertanyaan yang Sering Diajukan

Temukan jawaban untuk pertanyaan umum tentang IndexTTS

Siap Membuat Ucapan Alami?

Mulai gunakan IndexTTS hari ini untuk mengubah teks Anda menjadi ucapan berkualitas tinggi dan terdengar alami dengan kemampuan kloning suara canggih

IndexTTS dilatih pada 25.000 jam audio Mandarin dan 9.000 jam audio Inggris, memastikan kualitas kelas profesional untuk proyek Anda