Florence-2 (Microsoft)開源模型 – 影像識別 (英)輕量級視覺語言模型模型在字幕、物件偵測、接地和分割等任務中展示了強大的零樣本和微調功能。 繼 Meta 推出多模態 open source 模型,Microsoft 也不甘後人,推出影像識別 Open source Florence-2 模型 儘管尺寸很小,但它所取得的結果與大許多倍的模型(如 Kosmos-2)相當。該模型的優勢不在於複雜的架構,而在於大規模的 FLD-5B 資料集,其中包含 1.26 億張影像和 54 億個綜合視覺註釋。 Like Dislike1
語音即時對話教學 Voice Assistant How to build a real-time AI assistant (with voice and vision) Watch this video on YouTube 附源碼 Like Dislike
MoA : 合拼多模型 (英)MoA 允許您將多個小型模型(稱為「代理人」)组合成一個更強大的模型。透過採用每層包含多個 LLM 代理程式的分層架構,MoA 僅使用開源模型,在 AlpacaEval 2.0 上的得分為 65.1%,顯著優於 GPT-4 Omni 的 57.5%! Like Dislike
用 ORPO 微調 Llama3 (英)使用 ORPO 和 TRL 函式庫對新的 Llama 3 8B 模型進行微調。程式碼已放在 Google Colab 和 GitHub 上。 Like Dislike
AI Won’t Be AGI, Until It Can At Least Do This AI Won't Be AGI, Until It Can At Least Do This (plus 6 key ways LLMs are being upgraded) Watch this video on YouTube Like Dislike
StableSwarmUI 支援 Stable Diffusion 3 (英)StableSwarmUI,模組化 Web 介面, 重點在於易於存取、高效能和可擴展性您可以在 Google Colab 或 Runpod 上運行 StableSwarmUI。或者,您可以按照文中说明在 Windows、Linux 或 Mac 上安裝它。 Install Stable Diffusion 3 Locally: Step-by-Step with StableSwarmUI & ComfyUIWatch this video on YouTube安裝教學及測試 Like Dislike
LLM Analytics 可視化用量監察工具 GitHub – labmlai/inspectus: LLM Analytics法學碩士分析。透過在 GitHub 上建立帳戶來為 labmlai/inspectus 開發做出貢獻。 Inspectus 是一款適用於大型語言模型的多功能視覺化工具。它透過易於使用的 Python API 在 Jupyter 中流暢運行。 Inspectus 提供多種視圖,提供語言模型行為的不同見解。 Like Dislike