当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

5个月前 (02-25)Deepseek最新资讯267

新京报贝壳财经讯(记者罗亦丹)北京时间2月24日上午,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码。

据了解,MLA(多头潜在注意力机制)正是DeepSeek降低大模型成本使用的关键技术之一,其可以显著减少大模型训练和推理过程中的内存占用,而FlashMLA则是针对Hopper GPU(一种英伟达GPU架构)开发的高效MLA解码内核,其针对可变长度序列进行了优化,目前已投入了生产,其可以使得H800达到3000GB/s内存,实现580TFLOPS(每秒浮点运算次数)计算性能。

贝壳财经记者注意到,根据此前DeepSeek发布V3大模型时公开的技术文档,该大模型正是使用英伟达的H800芯片训练而成。

上海骊翰科技咨询有限公司发文称,FlashMLA能在不损失模型性能的前提下,将缓存体积压缩至原来的1/4,从而大幅降低显存需求。例如,原始需要存储的100GB中间结果,压缩后仅需25GB,通过开源让企业可以直接使用FlashMLA来优化自家模型。随着FlashMLA的普及,AI推理有望进入千元级硬件跑百亿模型的时代。


“DeepSeek发布开源周首个成果 可优化英伟达GPU效率” 的相关文章

“博惠办”DeepSeek智能服务正式上线!

“博惠办”DeepSeek智能服务正式上线!

当“国产AI之光”DeepSeek接入政务服务,将会带来怎样的加速度?博山区行政审批服务局将AI大模型技术运用于政务服务智能问答场景,推出“博惠办”DeepSeek智能政服,为企业群众提供智能化、便捷...

平台应用双升级 中关村科金的DeepSeek企业应用之道

平台应用双升级 中关村科金的DeepSeek企业应用之道

中新网上海新闻3月13日电(汤彦俊)3月13日,由中关村科金与上海市人工智能行业协会联合主办的"DeepSeek企业应用之道——2025大模型技术与应用创新城市论坛"在上海圆满落幕...

西安举办“解码DeepSeek——大模型技术与应用主题论坛”

西安举办“解码DeepSeek——大模型技术与应用主题论坛”

2月21日,由西安市科学技术局指导,西安电子科技大学人工智能学院、西安市人工智能产业发展联盟等主办的“解码DeepSeek——大模型技术与应用主题论坛”在西安市举行。本次论坛聚焦以DeepSeek为代...

车企扎堆接入DeepSeek,真有用还是纯噱头?

车企扎堆接入DeepSeek,真有用还是纯噱头?

今年春节前后,一场围绕DeepSeek展开的“AI风暴”席卷汽车行业。《消费者报道》统计发现,截至2月20日,已有20余家车企和品牌宣布与DeepSeek深度融合,包括吉利、奇瑞、长安、上汽、东风、广...

商业银行接入DeepSeek大赛:谁抢先,谁落后

商业银行接入DeepSeek大赛:谁抢先,谁落后

银行正加速DeepSeek系列模型本地化部署工作,“含D量”比拼战局愈演愈烈。3月8日,工商银行宣布于近期完成DeepSeek最新开源大模型的私有化部署,并将其接入行内“工银智涌”大模型矩阵体系。据北...

中电万维助力兰州政务系统接入DeepSeek 打造“小兰AI答”

中电万维助力兰州政务系统接入DeepSeek 打造“小兰AI答”

2月24日,中电万维应兰州市数据局要求,将DeepSeek人工智能大模型接入兰州市政府门户网站,打造DeepSeek在兰州市的首个应用场景。万维迅速组建DeepSeek专项协同攻坚队,55小时内圆满完...