香港中文大學(深圳)、上海人工智慧實驗室和深圳大數據研究院聯合開發。
Amphion 是一個多功能工具包,可促進音訊、音樂和語音生成方面的研究和開發。它強調可重複的研究以及經典模型的獨特視覺化。Amphion 的中心目標是全面了解不同輸入的音訊轉換。它支援單獨的生成任務,提供用於高品質音訊製作的聲碼器,並包括用於一致性能評估的基本評估指標。
該研究強調機器學習的進步,音訊、音樂和語音生成的快速發展。在開源社群中,Amphion 是唯一支援多種生成任務(包括音訊、音樂演唱和語音)的平台。其獨特的視覺化功能可以對生成過程進行互動式探索,從而提供模型內部結構的見解。