KTransformers 克服資源限制 KTransformers 透過先進的核心優化技術來增強 Transformers 的體驗。KTransformers 特別為硬件資源有限的本地部署,並支援異構運算,例如量化模型的 GPU/CPU 卸載,令到不同的架構處理器可以協同工作。KTransformers 亦提供了一個 YAML 範本來呼叫特殊的優化指令。结果可以令 RTX 4090 本地運行 DeepSeek-R1、V3 的 671 B 满血版,以 24 Gig VRam 最高推理速度仍達到 14 tokens/s。當然,你亦需要保証足夠 D Ram。
Deepseek – VL2 視覺模型 DeepSeek-VL2 使用 MoE 混合專家 Mixture-of-Experts 的視覺語言模型,主要在於提升多模態理解能力。DeepSeek-VL2 在視覺問答、光學字元識別、文件理解和視覺基礎等方面表現出色。模型包含三個版本:Tiny、Small 和 Base,並提供了模型下載、Gradio web 介面範例。
DeepSeek & Crawl4AI 爬蟲! 這影片教你如何使用 DeepSeek AI 和 Crawl4AI 驅動網頁爬蟲,甚至無需編寫任何程式,就能輕鬆地從任何網站收集結構化數據。影片同時亦展示了一個實際案例,講解點樣為公司尋找潛在客戶,包括地址、企業名稱和聯絡方式等資訊,然後將數據匯入試算表進行整理和分析。 Scrape Any Website for FREE & NO CODE Using DeepSeek & Crawl4AI! (Opensource)Watch this video on YouTube
Transformer Lab 桌面 LLM 工作台 Transformer Lab 是個免費的開源 LLM 工作平台,方便進行微調、評估、匯出和測試,並支援唔同的推理引擎和平台。Transformer Lab 適用於擁有 GPU 或 TPU 的電腦,亦支援 MLX 的 M 系列的蘋果電腦。主要功能包括下載開源模型、智能聊天、計算嵌入、創建和下載訓練數據集、微調和訓練 LLM、以及使用 R A G 與文件互動。
ComfyUI Sonic 音訊對應到嘴型(Lipsync) Sonic 不單將音訊對應到嘴型,而是更全面理解音訊的內容和情感,進而產生更自然、更加生動的人像動畫。可以配合 ComfyUI_Sonic 使用。項目亦包括 Realtalk 即時同逼真的音訊驅動人臉生成技術。新增 frame number 選項,可以控制輸出影片的長度。亦可基於音頻長度。
Tokenizers 分詞器的摘要 分詞對訓練模型相當重要。簡單來說,就是將一段文本分割成很多單詞或者子單詞, 這些單詞或者子單詞將會通過一個表格被認知為名詞,專有名詞,或是助語詞之類,也就是將文章的詞彙轉為有意義的關建數值。這個 HuggingFace 的介紹包含了 CoLab 嘅筆記,你可以直接試用不同的分詞技術。
AI 演算法工程師如何開發一個 AI 專案 【大模型工程开发】AI算法项目开发参考流程与案例Watch this video on YouTube 影片旨在澄清外界對 AI 演算法工程師的誤解,並介紹了 AI 專案開發的實際情況和所需技能,強調了演算法工程師在專案中除了模型開發,也需要具備工程開發能力,並能根據專案需求靈活調整開發策略。 國外網站上常見兩種職位: 數據科學家 (Data Scientist): 專注於演算法開發,目標是提高模型準確度和效率,並降低資源開銷。他們會參與數據競賽,優化模型,進行數據清洗等工作。 AI 工程師 (AI Engineer/Machine Learning Engineer): 專注於 AI 應用開發,將已開發好的模型部署成實際可用的應用。例如,將模型部署成 API 服務,並考慮模型工程化、服務穩定性、並發處理、模型可視化以及在嵌入式系統或效能不佳的機器上優化等問題。 影片中也提到,還有一類頂尖的演算法工程師,他們會提出新的演算法或模型架構。 本片的 GitHub 方案
正確的 LLM 微調數據處理方法 【LLM大模型】如何整理训练数据以及微调优化建议Watch this video on YouTube 這部影片主要探討了大型語言模型(LLM)微調數據的整理方法,並針對微調優化提出了實用建議,核心問題包含: 微調數據集的形式: 應該如何整理微調數據集? AI 輔助數據整理: 是否能利用 AI 協助整理數據? 微調效果不佳的原因: 為什麼微調後模型效果不明顯? 業務場景數據來源: 實際業務中,微調所需的數據從何而來? 影片內容重點 基礎知識科普: 影片首先簡要介紹了大型語言模型的基礎概念,例如自迴歸模型和指令微調等。 數據格式探討: 深入討論了數據格式的重要性,並介紹了 llama factory 框架支持的兩種主要數據格式:Pack 和 saregpt。同時說明如何根據不同的微調任務(如指令微調、預訓練、Function Calling 等)選擇合適的數據格式。 微調優化建議: 分享了多項優化微調效果的建議,包括: 清晰定義任務目標 確保數據質量與多樣性 增加額外信息以豐富數據 靈活調整訓練策略 業務場景數據獲取: 探討了在實際業務場景中,如何獲取和標註微調數據,並強調了數據質量對模型性能的關鍵影響。建議觀眾在開始微調前,務必明確任務目標,並仔細整理和清洗數據。 總體而言,這部影片內容豐富且深入淺出,對於希望了解大型語言模型微調數據整理和優化方法的觀眾來說,具有相當高的參考價值。
ACE++ 圖像生成與編輯任務 ACE++ 基於指令的擴散框架,只要輸入一張圖像即可生成與角色一致的新圖像,專門用來處理各種圖像生成和編輯任務。靈感來自 FLUX.1-Fill-dev 的輸入格式,以雙階段訓練方法來減少對圖像擴散模型進行微調所需的工作量。這框架提供了全面的模型集,涵蓋了完整微調和輕量級微調,在生成圖像品質和遵循提示能力方面展現了卓越的性能,可以廣泛應用於人像一致性、靈活指令描述和局部編輯等不同情境。
總結近期在人工智慧影片技術上的突破 這是近期較完整的影片,總結了近期在人工智慧影片技術上的突破,這些技術正快速改變著影片製作的流程。影片亦展望了未來 AI 和 3D 影片的融合創作,能夠在一個統一的場景圖中,以更高的抽象層次協調和導演式的指揮創作,實現更輕量化、更高效的影片製作流程。 7 Explosive AI Video Breakthroughs (Pika, Meta, Topaz & More) Changing Filmmaking Right NowWatch this video on YouTube Pikadditions & Pika 2.1 OmniHuman-1 (ByteDance VideoJAM SAMURAI (enhanced SAM2) Movie Gen (Meta AI) MidJourney CEO on Future of 3D & AI Video Odyssey ML Krea AI real-time Krea Image to 3D to image 3D + AI Video Techniques Topaz Starlight Upscaling MoCapade 3.0 Future of AI Video Creation