首页 > 行业资讯 > 人物文章正文

DeepSeek宣布开源DeepGEMM

人物 2025-02-27 陈晓楠
后台-插件-广告管理-内容页头部广告(手机)
Deepseek于开源周第三天宣布开源DeepGEMM。DeepGEMM 是一个专为简洁高效的 FP8 通用矩阵乘法(GEMM)设计的库,具有细粒度缩放功能,如 DeepSeek-V3 中所提出。它支持普通和混合专家(MoE)分组的 GEMM。该库采用 CUDA 编写,在安

Deepseek于开源周第三天宣布开源DeepGEMM。DeepGEMM 是一个专为简洁高效的 FP8 通用矩阵乘法(GEMM)设计的库,具有细粒度缩放功能,如 DeepSeek-V3 中所提出。它支持普通和混合专家(MoE)分组的 GEMM。

该库采用 CUDA 编写,在安装过程中无需编译,通过使用轻量级的即时编译(JIT)模块在运行时编译所有内核。FP8GEMM库,为V3/R1训练和推理提供支持。


(来源金融界)
后台-插件-广告管理-内容页尾部广告(手机)

标签:

备案号:沪ICP备2023024783号

南方城市网声明网站刊载内容均转载自网络,转载目的仅为传播有价值学习分享,并不代表本网站的观点。如有侵权行为,请发送邮件至 Help_Times@163.com