DeepSeek 開放源碼週

DeepSeek 開放源碼週(Open Source Week)是由中國人工智能初創公司 DeepSeek 於 2025 年 2 月 24 日至 2 月 28 日舉辦的一項活動,旨在展示其對構建開放、協作性 AI 生態系統的承諾。在此期間,DeepSeek 每天發布一個開源代碼庫,共計五個,這些代碼庫已在生產環境中得到驗證並應用於其線上服務。以下是活動的總結及其重要內容:
活動概覽
DeepSeek 開放源碼週從 2 月 24 日開始,持續五天,每天推出一項新的開源工具,這些工具涵蓋了機器學習工作流程加速、深度學習模型優化、計算效率提升以及大規模數據處理等領域。這些代碼庫在 GitHub 和 Hugging Face 上免費提供,並附有詳細文檔,供全球開發者和研究人員使用。DeepSeek 表示,此舉是為了分享其「微小但真誠的進展」,並強調「每一行共享的代碼都成為推動旅程的集體動力」。
每日發布內容
- 第一天(2 月 24 日):FlashMLA
- 一個針對 NVIDIA Hopper GPU 優化的高效解碼內核,適用於可變長度序列。
- 特點:支持 BF16、頁式 KV 緩存,性能達 3000 GB/s 內存帶寬和 580 TFLOPS 計算能力(H800 GPU)。
- 在 GitHub 上發布後數小時內獲得超過 5000 顆星,顯示出極高的社區關注度。
- 網址: https://github.com/deepseek-ai/FlashMLA
- 第二天(2 月 25 日):DeepEP
- 全球首個針對混合專家模型(MoE)訓練和推理的開源 EP(專家並行)通信庫。
- 特點:支持內節點和跨節點通信(NVLink 和 RDMA),提供高吞吐量和低延遲內核,支持 FP8。
- 網址: https://github.com/deepseek-ai/DeepEP
- 第三天(2 月 26 日):DeepGEMM
- 一款支持 FP8 的通用矩陣乘法(GEMM)開源庫,適用於密集和 MoE 矩陣運算。
- 特點:在 Hopper GPU 上實現 1350+ TFLOPS 性能,核心代碼僅約 300 行,採用即時編譯(JIT),無複雜依賴。
- 網址: https://github.com/deepseek-ai/DeepGEMM
- 第四天(2 月 27 日):DualPipe – 優化的並行策略
- 一套針對大規模 AI 模型訓練和推理的並行優化策略。
- 特點:提高 GPU 利用率並減少內存訪問需求,特別適用於高稀疏性模型。
- 網址: https://github.com/deepseek-ai/DualPipe
- 第五天(2 月 28 日):Fire-Flyer File System (3FS)
- 一個高性能並行文件系統,被稱為「DeepSeek 數據訪問的加速器」。
- 特點:提升 AI 和大數據應用的數據訪問速度和可擴展性,適合集群環境。
- 網址: https://github.com/deepseek-ai/3FS
額外亮點:DeepSeek-V3/R1 推理系統
在開放源碼週結束後,DeepSeek 額外介紹了其 DeepSeek-V3/R1 推理系統,該系統利用跨節點專家並行(EP)技術,優化大規模 AI 推理的吞吐量和延遲。這一系統展示了 DeepSeek 在構建高效 AI 基礎設施方面的進一步努力。
意義與影響
- 技術透明與協作:DeepSeek 的開源策略不僅展示了其技術實力,還為中小型團隊和獨立開發者提供了與行業巨頭競爭的機會。這些工具的發布促進了 AI 基礎設施的發展,並推動了全球開發者社區的創新。
- 成本效益:DeepSeek 以低成本實現高性能的案例(例如 R1 模型訓練成本僅 600 萬美元)挑戰了傳統的高投入模式,對行業成本結構產生壓力。
- 全球反響:活動獲得了廣泛讚譽,例如杭州 GeTui 首席執行官方毅將其比喻為「Android 時代」的變革性運動,認為它開啟了 AI 領域的新格局。
DeepSeek 的願景
DeepSeek 創始人梁文峰曾表示,開源不僅是商業行為,更是一種文化行為,通過分享技術可以贏得尊重並推動生態系統發展。此次開放源碼週體現了其「無象牙塔,只有車庫能量與社區驅動創新」的理念,顯示出其致力於打破技術壁壘並加速 AGI(人工智慧通用)探索的決心。
總之,DeepSeek 開放源碼週不僅是一場技術盛宴,更標誌著開源 AI 在全球範圍內的崛起,為開發者和研究人員提供了強大的工具,並可能重塑 AI 產業的競爭格局。如需深入探索這些工具,可前往 DeepSeek 的 GitHub 頁面查看完整代碼和文檔。