IndexTTS
IndexTTS 是 Bilibili 開發的工業級文字轉語音系統,提供高品質的語音合成,具有零樣本聲音複製、多語言支援和情感控制功能。
IndexTTS 的文字輸入指南
了解如何製作有效的文字輸入,以獲得最佳的語音合成效果
基本要素
清晰的文字結構
使用適當的標點符號來控制生成的語音中的停頓和節奏
發音提示
對於中文文本,使用拼音標記來校正多音字
情感標籤
指定情感基調,使語音更具表現力和自然感
語言混合
在您的文字輸入中無縫混合中文和英文
獲得更好結果的專業提示
使用自然的標點符號
自然地添加逗號、句號和感嘆號,以控制語音節奏和停頓
高品質參考音訊
對於聲音複製,請使用清晰的參考音訊,並儘量減少背景噪音(5-10 秒是最佳的)
分解長文本
將非常長的文本分成較小的塊,以獲得更一致的品質和更輕鬆的處理
測試發音
對於帶有生僻字的中文文本,請測試發音,並在需要時添加拼音校正
基本輸入 vs 增強輸入
"今天天气很好"
"今天天气很好,让我们出去走走吧!"
"I have great news to share"
"[Excited] I have great news to share with everyone!"
如何使用 IndexTTS
按照這些簡單的步驟,從您的文字生成高品質的語音
準備您的文字
輸入或粘貼您要轉換為語音的文字。使用適當的標點符號,並在需要時添加發音提示。
上傳參考音訊(可選)
對於聲音複製,上傳目標聲音的 5-10 秒清晰音訊樣本。跳過此步驟以使用預設聲音。
選擇語言和情感
選擇您的主要語言(中文/英文),如果您想要富有表現力的語音,請選擇一個情感標籤。
生成和下載
點擊生成以創建您的音訊。預覽結果,並在滿意時下載音訊文件。
快速提示
- •參考音訊應清晰,背景噪音儘量小,以獲得最佳的聲音複製效果
- •較長的文本可能需要更長的時間來處理 - 考慮將它們分成較小的片段
- •嘗試不同的標點符號模式,以實現您想要的語音節奏
- •對於中文文本,拼音校正可以顯著提高發音準確性
生成的語音品質取決於輸入文字的清晰度和參考音訊品質(對於聲音複製)。為了獲得最佳效果,請使用格式良好的文字和自然的標點符號。
常見問題解答
查找有關 IndexTTS 的常見問題的答案
準備好創建自然的語音了嗎?
立即開始使用 IndexTTS,將您的文字轉換為高品質、自然聲音的語音,並具有先進的聲音複製功能
IndexTTS 在 25,000 小時的中文音訊和 9,000 小時的英文音訊上進行了訓練,確保您的項目具有專業級品質