Amphion 多功能聲頻 LLM

Amphion(/æmˈfaɪən/) 是一個用於音訊、音樂和語音生成的工具包

支持可重複的研究，並幫助初級研究人員和工程師開始音訊、音樂和語音生成研究和開發領域。

香港中文大學（深圳）、上海人工智慧實驗室和深圳大數據研究院聯合開發。

Amphion 是一個多功能工具包，可促進音訊、音樂和語音生成方面的研究和開發。它強調可重複的研究以及經典模型的獨特視覺化。Amphion 的中心目標是全面了解不同輸入的音訊轉換。它支援單獨的生成任務，提供用於高品質音訊製作的聲碼器，並包括用於一致性能評估的基本評估指標。

該研究強調機器學習的進步，音訊、音樂和語音生成的快速發展。在開源社群中，Amphion 是唯一支援多種生成任務（包括音訊、音樂演唱和語音）的平台。其獨特的視覺化功能可以對生成過程進行互動式探索，從而提供模型內部結構的見解。