当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

4个月前 (02-24)Deepseek最新资讯208

新京报贝壳财经讯(记者罗亦丹)北京时间2月24日上午,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码。


据了解,MLA(多头潜在注意力机制)正是DeepSeek降低大模型成本使用的关键技术之一,其可以显著减少大模型训练和推理过程中的内存占用,而FlashMLA则是针对Hopper GPU(一种英伟达GPU架构)开发的高效MLA解码内核,其针对可变长度序列进行了优化,目前已投入了生产,其可以使得H800达到3000GB/s内存,实现580TFLOPS(每秒浮点运算次数)计算性能。


贝壳财经记者注意到,根据此前DeepSeek发布V3大模型时公开的技术文档,该大模型正是使用英伟达的H800芯片训练而成。


上海骊翰科技咨询有限公司发文称,FlashMLA能在不损失模型性能的前提下,将缓存体积压缩至原来的1/4,从而大幅降低显存需求。例如,原始需要存储的100GB中间结果,压缩后仅需25GB,通过开源让企业可以直接使用FlashMLA来优化自家模型。随着FlashMLA的普及,AI推理有望进入千元级硬件跑百亿模型的时代。


“DeepSeek发布开源周首个成果 可优化英伟达GPU效率” 的相关文章

深入探索!DeepSeek软件的强大功能与使用技巧

深入探索!DeepSeek软件的强大功能与使用技巧

标题:深入探索!DeepSeek软件的强大功能与使用技巧关键词:DeepSeek,软件使用,数据分析,搜索技巧,智能工具描述:DeepSeek软件以其卓越的数据分析和精准的搜索能力在市场上赢得了广泛关...

从DeepSeek-R1看AI国产化的全球突围

从DeepSeek-R1看AI国产化的全球突围

近期,中国初创公司深度求索(DeepSeek)推出的大模型DeepSeek-R1引发全球关注。这款完全基于国产技术研发的AI产品,不仅在自然语言处理、多模态交互等领域展现出不逊于国际顶尖模型的性能,更...

Kimi和DeepSeek又又又撞车?

Kimi和DeepSeek又又又撞车?

摘要:据凤凰网科技了解,今年杨植麟的关注重心早已发生改变。2月底,Kimi内部在重点推进模型表现的提升,“杨植麟亲自带队”。近期,Kimi则专注垂直领域,核心都是提升模型能力上限。几个大模型初创企业里...

全面拥抱DeepSeek后,江苏还有哪些可能?

全面拥抱DeepSeek后,江苏还有哪些可能?

随着DeepSeek的迅猛发展,AI的热情和想象力被加速释放。然而在实践中,仍有很多产业深水区的暗礁未被触及。企业是否真的能“接入即起飞”?哪些行业更有潜在的AI空间?江苏还有哪些“AI+”的可能?这...

360推出DS大模型安全解决方案 守护DeepSeek发展

360推出DS大模型安全解决方案 守护DeepSeek发展

360集团基于对大模型安全风险的深入研究,推出DS大模型安全解决方案,旨在覆盖大模型训练、推理、运营等全过程,促进国产大模型企业向安全、向善、可信、可控的方向发展。该方案针对系统安全、数据安全、内容安...

江门多家企事业单位“牵手”DeepSeek

江门多家企事业单位“牵手”DeepSeek

今年以来从政务服务到创意创作从企业研发生产到产品升级千行百业纷纷接入DeepSeek它宛如一把钥匙开启各行各业智能化变革的大门市委十四届八次全会暨全市高质量发展大会强调,要实施“人工智能+”行动计划,...