VALL-E X: 多語言文本到語音合成與語音克隆 🔊

ALL-E X 是一個強大而創新的多語言文本轉語音(TTS)模型,最初由微軟發佈。雖然微軟最初在他們的研究論文中提出了該概念,但並未發佈任何代碼或預訓練模型。我們認識到了這項技術的潛力和價值,復現並訓練了一個開源可用的VALL-E X模型。我們很樂意與社區分享我們的預訓練模型,讓每個人都能體驗到次世代TTS的威力。 🎧更多細節請查看 model card.