DeepSeek 開放源碼週

DeepSeek 開放源碼週（Open Source Week）是由中國人工智能初創公司 DeepSeek 於 2025 年 2 月 24 日至 2 月 28 日舉辦的一項活動，旨在展示其對構建開放、協作性 AI 生態系統的承諾。在此期間，DeepSeek 每天發布一個開源代碼庫，共計五個，這些代碼庫已在生產環境中得到驗證並應用於其線上服務。以下是活動的總結及其重要內容：

活動概覽

DeepSeek 開放源碼週從 2 月 24 日開始，持續五天，每天推出一項新的開源工具，這些工具涵蓋了機器學習工作流程加速、深度學習模型優化、計算效率提升以及大規模數據處理等領域。這些代碼庫在 GitHub 和 Hugging Face 上免費提供，並附有詳細文檔，供全球開發者和研究人員使用。DeepSeek 表示，此舉是為了分享其「微小但真誠的進展」，並強調「每一行共享的代碼都成為推動旅程的集體動力」。

每日發布內容

第一天（2 月 24 日）：FlashMLA

一個針對 NVIDIA Hopper GPU 優化的高效解碼內核，適用於可變長度序列。
特點：支持 BF16、頁式 KV 緩存，性能達 3000 GB/s 內存帶寬和 580 TFLOPS 計算能力（H800 GPU）。
在 GitHub 上發布後數小時內獲得超過 5000 顆星，顯示出極高的社區關注度。
網址: https://github.com/deepseek-ai/FlashMLA

第二天（2 月 25 日）：DeepEP

全球首個針對混合專家模型（MoE）訓練和推理的開源 EP（專家並行）通信庫。
特點：支持內節點和跨節點通信（NVLink 和 RDMA），提供高吞吐量和低延遲內核，支持 FP8。
網址: https://github.com/deepseek-ai/DeepEP

第三天（2 月 26 日）：DeepGEMM

一款支持 FP8 的通用矩陣乘法（GEMM）開源庫，適用於密集和 MoE 矩陣運算。
特點：在 Hopper GPU 上實現 1350+ TFLOPS 性能，核心代碼僅約 300 行，採用即時編譯（JIT），無複雜依賴。
網址: https://github.com/deepseek-ai/DeepGEMM

第四天（2 月 27 日）：DualPipe – 優化的並行策略

一套針對大規模 AI 模型訓練和推理的並行優化策略。
特點：提高 GPU 利用率並減少內存訪問需求，特別適用於高稀疏性模型。
網址: https://github.com/deepseek-ai/DualPipe

第五天（2 月 28 日）：Fire-Flyer File System (3FS)

一個高性能並行文件系統，被稱為「DeepSeek 數據訪問的加速器」。
特點：提升 AI 和大數據應用的數據訪問速度和可擴展性，適合集群環境。
網址: https://github.com/deepseek-ai/3FS

額外亮點：DeepSeek-V3/R1 推理系統

在開放源碼週結束後，DeepSeek 額外介紹了其 DeepSeek-V3/R1 推理系統，該系統利用跨節點專家並行（EP）技術，優化大規模 AI 推理的吞吐量和延遲。這一系統展示了 DeepSeek 在構建高效 AI 基礎設施方面的進一步努力。

意義與影響

技術透明與協作：DeepSeek 的開源策略不僅展示了其技術實力，還為中小型團隊和獨立開發者提供了與行業巨頭競爭的機會。這些工具的發布促進了 AI 基礎設施的發展，並推動了全球開發者社區的創新。
成本效益：DeepSeek 以低成本實現高性能的案例（例如 R1 模型訓練成本僅 600 萬美元）挑戰了傳統的高投入模式，對行業成本結構產生壓力。
全球反響：活動獲得了廣泛讚譽，例如杭州 GeTui 首席執行官方毅將其比喻為「Android 時代」的變革性運動，認為它開啟了 AI 領域的新格局。

DeepSeek 的願景

DeepSeek 創始人梁文峰曾表示，開源不僅是商業行為，更是一種文化行為，通過分享技術可以贏得尊重並推動生態系統發展。此次開放源碼週體現了其「無象牙塔，只有車庫能量與社區驅動創新」的理念，顯示出其致力於打破技術壁壘並加速 AGI（人工智慧通用）探索的決心。

總之，DeepSeek 開放源碼週不僅是一場技術盛宴，更標誌著開源 AI 在全球範圍內的崛起，為開發者和研究人員提供了強大的工具，並可能重塑 AI 產業的競爭格局。如需深入探索這些工具，可前往 DeepSeek 的 GitHub 頁面查看完整代碼和文檔。