加密快訊
DeepSeek 開源 TileKernels 算子庫,支持 NVIDIA Blackwell 架構
2026.04.23 17:49
GitHub頁面顯示,DeepSeek 開源高性能 GPU 算子庫 TileKernels,該項目基於 TileLang 開發。該庫針對大語言模型(LLM)的訓練與推理進行了深度優化,其算子性能已接近硬件計算強度與內存帶寬的極限。 TileKernels 涵蓋了 MoE 路由、FP8/FP4 量化及多種融合算子,並已在 DeepSeek 內部環境投入使用。該庫目前適配 NVIDIA SM90 及最新的 SM100(Blackwell)架構,運行環境要求 CUDA 13.1 及以上版本。