您现在的位置是:首页 > 快讯快讯
DeepSeek宣布开源DeepGEMM
zhoucl 2025-02-26 09:40:27 快讯 已有人查阅
导读Deepseek于开源周第三天宣布开源DeepGEMM。DeepGEMM是一个专为简洁高效的 FP8 通用矩阵乘法(GEMM)设计的库,具有细粒度缩放功能,如DeepSeek-V3中所提出。它支持普通和混合专家(MoE)分组的GEMM。该库采用CUDA编写,在安装过程中无需编译,通过使用轻量级的即时编译(JIT)模块在运行时编译所有内核。FP8GEMM库,为V3/R1训练和推理提供支持。(金十)
Deepseek在开源周第三天宣布开源DeepGEMM库。DeepGEMM专为高效FP8通用矩阵乘法设计,支持细粒度缩放和普通及混合专家(MoE)分组的GEMM。该库基于CUDA开发,无需编译安装,通过轻量级JIT模块在运行时编译内核。DeepGEMM支持V3/R1训练和推理。(金十)
本文标签:
很赞哦! ()