当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

4个月前 (02-25)Deepseek最新资讯190

新京报贝壳财经讯(记者罗亦丹)北京时间2月24日上午,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码。

据了解,MLA(多头潜在注意力机制)正是DeepSeek降低大模型成本使用的关键技术之一,其可以显著减少大模型训练和推理过程中的内存占用,而FlashMLA则是针对Hopper GPU(一种英伟达GPU架构)开发的高效MLA解码内核,其针对可变长度序列进行了优化,目前已投入了生产,其可以使得H800达到3000GB/s内存,实现580TFLOPS(每秒浮点运算次数)计算性能。

贝壳财经记者注意到,根据此前DeepSeek发布V3大模型时公开的技术文档,该大模型正是使用英伟达的H800芯片训练而成。

上海骊翰科技咨询有限公司发文称,FlashMLA能在不损失模型性能的前提下,将缓存体积压缩至原来的1/4,从而大幅降低显存需求。例如,原始需要存储的100GB中间结果,压缩后仅需25GB,通过开源让企业可以直接使用FlashMLA来优化自家模型。随着FlashMLA的普及,AI推理有望进入千元级硬件跑百亿模型的时代。


“DeepSeek发布开源周首个成果 可优化英伟达GPU效率” 的相关文章

联想2月25日开始AI PC端侧DeepSeek模型灰度测试

联想2月25日开始AI PC端侧DeepSeek模型灰度测试

联想集团执行副总裁兼中国区总裁刘军透露,2月25日,联想将对天禧AS做大的升级,将在天禧AS里部署DeepSeek 7B的大模型,这是端侧部署这样规模大模型的首家AI PC厂商。此次升级将会使得联想A...

智能应对多种场景 DeepSeek助力四川环境应急

智能应对多种场景 DeepSeek助力四川环境应急

4月6日,记者从四川省生态环境厅获悉,近日新增一位环境应急“助手”——一款基于DeepSeek大模型与生态环境应急指挥平台深度融合的AI助手。目前,通过阶段性探索,该AI助手已初步形成智能问答、智能分...

当红炸子鸡DeepSeek,为何花心思自研存储?

当红炸子鸡DeepSeek,为何花心思自研存储?

国产大模型DeepSeek横空出世,新的技术突破正快速转化为行业价值。近日,宇视科技正式推出DeepSeek一体机系列,以“开箱即用、私有化部署、应用赋能”等特性,无缝衔接用户需求,让智能应用真正“用...

腾讯、华为等接入DeepSeek每月亏损超4亿

腾讯、华为等接入DeepSeek每月亏损超4亿

钛媒体App 2月19日消息,近日,腾讯、百度、华为、阶跃星辰等多家AI大模型企业接入DeepSeek-R1模型,使得“DeepSeek朋友圈”企业超过100家。尽管DeepSeek R1模型具备训练...

杭州文旅智能体“杭小忆”全面接入DeepSeek!旅游体验开启“超进化”时代

杭州文旅智能体“杭小忆”全面接入DeepSeek!旅游体验开启“超进化”时代

潮新闻客户端 记者 杨希林3月1日,全国首个城市级文旅智能体杭小忆,全面接入DeepSeek-R1。此次升级,杭州城市大脑智能中枢以“隐形桥梁”之姿,实现DeepSeek-R1在政务信创环境的部署应用...

DeepSeek“智”变永川 科技点亮民生产业新场景

DeepSeek“智”变永川 科技点亮民生产业新场景

今年以来,永川区抢抓人工智能大模型重大战略机遇,着力推动人工智能大模型特别是DeepSeek在各行业中的应用。“科技影视大模型”“AI工程师”“AI智教授”“AI医生助手”从梦想走进现实。科技不再是冰...