当前位置:首页 > Deepseek最新资讯 > 正文内容

全面适配!京东云将DeepSeek推理场景性能提升50%

3个月前 (03-03)Deepseek最新资讯210

央广网北京3月3日消息 在DeepSeek为期五天的“开源周”中,其连续开源的五大核心技术(FlashMLA、DeepEP、DeepGEMM、DualPipe & EPLB、3FS文件系统),惊艳全球。

京东云率先宣布完成对这五项技术的全栈适配,在模型推理效率、算力资源利用率及数据管理等领域实现突破性优化,综合Flash MLA、DeepEP、FP8 GEMM、DualPipe四方面的调优,在DeepSeek推理场景下性能提升50%。

全面适配五大技术,DeepSeek推理场景性能提升50%

作为DeepSeek开源首日的重磅技术,Flash MLA通过动态调度GPU的显存与算力资源,解决了传统方法处理变长序列时的资源浪费问题。

京东vGPU AI算力平台通过支持Flash MLA的FP8格式来提升推理性能,使单Token的 KV Cache显存占用相比Multi-head Attention降低57倍,配合最新的投机推理技术,以极低的显存需求,在高并发请求场景下保证了推理的吞吐量和延迟表现。

此外,针对用于DeepSeek开源的通信库DeepEP,京东云vGPU AI算力平台已全面支持EP模式下的分布式推理,显著提高推理吞吐。通过整合DeepEP作为通信后端,针对机内通信使用NVLink传输数据,机间通信使用NVSHMEM接口走RDMA网络,同时通过灵活的GPU SM数量利用控制,增大GPU算力资源利用率以及减少对计算算子的性能串。

更低成本更高效率,让大模型真正用起来

针对客户大模型的使用需求,京东云vGPU AI算力平台,为用户提供更高推理性能、更多国产芯片适配、更多高数据安全的大模型服务,让大模型真正用起来。

在推理性能方面,针对DeepSeek大模型技术特点,京东云通过推理加速与内核驱动级优化,提升单台服务器推理性能50%。

在国产芯片适配方面,京东云已完成从底层算力到大模型和业务应用的全面国产化适配,包括十余家国产化AI算力,确保自主可控。

在数据安全方面,通过机密容器AI全场景密态计算和先进的容器隔离技术,确保模型数据的机密性与完整性,为用户提供金融级安全防护。

目前,在河南鹤壁、江苏宿迁、山东滨州、广西北海、山西大同,京东云已经助力多地政府基于现有基础设施本地化部署DeepSeek,既满足本地政务业务,又让当地企业不用投入资源,即可通过政务云调用DeepSeek。


标签: DeepSeek

“全面适配!京东云将DeepSeek推理场景性能提升50%” 的相关文章

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

新京报贝壳财经讯(记者罗亦丹)北京时间2月24日上午,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码。据了解,MLA(多头潜在注意力机制)正是D...

特斯联特AI接入满血DeepSeek,为职场数智化转型注入新动能

特斯联特AI接入满血DeepSeek,为职场数智化转型注入新动能

2025年《政府工作报告》明确提出,要持续推进“人工智能+”行动,推动大模型技术向垂直场景渗透。在数字技术与实体经济深度融合的浪潮下,人工智能正加速重构职场办公的底层逻辑。作为AIoT领域的领军企业,...

DeepSeek-R2大模型上线在即,当贝AI或率先接入

DeepSeek-R2大模型上线在即,当贝AI或率先接入

4月30日凌晨DeepSeek更新Prover-V2大模型,据多方消息透露,国内AI技术领军企业深度求索(DeepSeek)计划于5月发布新一代旗舰大模型DeepSeek-R2,预计比GPT-4成本下...

“牵手”DeepSeek,福建监狱开启深度思考时代

“牵手”DeepSeek,福建监狱开启深度思考时代

在国家大力发展新质生产力的背景下福建监狱抢抓AI战略机遇以开展“强基提质 增效赋能”专项行动为契机于2024年初启动AI大模型创新项目试点单位仓山监狱率先完成多轮技术迭代论证在监狱内网部署千亿级参数大...

黄山市工业互联网平台实现全省首个DeepSeek接入

黄山市工业互联网平台实现全省首个DeepSeek接入

日前,在黄山市工业和信息化局的统筹规划与组织实施下,黄山电信依托天翼云算力和DeepSeek大模型,完成了黄山市工业互联网平台DeepSeek私有化部署,成为全省首个接入DeepSeek的工业互联网平...

QQ浏览器升级为AI浏览器,搭载混元和DeepSeek双模型

QQ浏览器升级为AI浏览器,搭载混元和DeepSeek双模型

5月19日消息,腾讯旗下的QQ浏览器,日前正式升级为AI浏览器,并全新推出QBot功能,搭载腾讯混元和DeepSeek双模型。资料显示,升级后的QQ浏览器将成为超级助手,在浏览时提供多种AI功能,帮助...