用 ORPO 微調 Llama3 (英)使用 ORPO 和 TRL 函式庫對新的 Llama 3 8B 模型進行微調。程式碼已放在 Google Colab 和 GitHub 上。 Like Dislike