MV-Adapter 多視角影像生成

MV-Adapter: Multi-view Consistent Image Generation Made Easy

MV-Adapter 是一款多功能的即插即用適配器，可將現有的預先訓練的文本到圖像 (T2I) 擴散模型轉變為多視圖生成器。不同於以往需要完整微調的繁複方法，MV-Adapter 透過更新較少參數，有效降低計算成本並避免過擬合。

它利用創新的雙重自我注意力層和平行注意力架構，高效建模 3D 幾何知識，並整合了條件編碼器以處理不同輸入，例如文字、圖片或幾何資訊。實驗結果顯示，MV-Adapter 在不同基礎 T2I 模型和控制條件下，都能生成高保真、多視角一致的影像，展現其適應性和多功能性，為多視角影像生成設定了新的品質標準。