当前位置:首页 > Deepseek最新资讯 > 正文内容

全面适配!京东云将DeepSeek推理场景性能提升50%

8个月前 (03-03)Deepseek最新资讯457

央广网北京3月3日消息 在DeepSeek为期五天的“开源周”中,其连续开源的五大核心技术(FlashMLA、DeepEP、DeepGEMM、DualPipe & EPLB、3FS文件系统),惊艳全球。

京东云率先宣布完成对这五项技术的全栈适配,在模型推理效率、算力资源利用率及数据管理等领域实现突破性优化,综合Flash MLA、DeepEP、FP8 GEMM、DualPipe四方面的调优,在DeepSeek推理场景下性能提升50%。

全面适配五大技术,DeepSeek推理场景性能提升50%

作为DeepSeek开源首日的重磅技术,Flash MLA通过动态调度GPU的显存与算力资源,解决了传统方法处理变长序列时的资源浪费问题。

京东vGPU AI算力平台通过支持Flash MLA的FP8格式来提升推理性能,使单Token的 KV Cache显存占用相比Multi-head Attention降低57倍,配合最新的投机推理技术,以极低的显存需求,在高并发请求场景下保证了推理的吞吐量和延迟表现。

此外,针对用于DeepSeek开源的通信库DeepEP,京东云vGPU AI算力平台已全面支持EP模式下的分布式推理,显著提高推理吞吐。通过整合DeepEP作为通信后端,针对机内通信使用NVLink传输数据,机间通信使用NVSHMEM接口走RDMA网络,同时通过灵活的GPU SM数量利用控制,增大GPU算力资源利用率以及减少对计算算子的性能串。

更低成本更高效率,让大模型真正用起来

针对客户大模型的使用需求,京东云vGPU AI算力平台,为用户提供更高推理性能、更多国产芯片适配、更多高数据安全的大模型服务,让大模型真正用起来。

在推理性能方面,针对DeepSeek大模型技术特点,京东云通过推理加速与内核驱动级优化,提升单台服务器推理性能50%。

在国产芯片适配方面,京东云已完成从底层算力到大模型和业务应用的全面国产化适配,包括十余家国产化AI算力,确保自主可控。

在数据安全方面,通过机密容器AI全场景密态计算和先进的容器隔离技术,确保模型数据的机密性与完整性,为用户提供金融级安全防护。

目前,在河南鹤壁、江苏宿迁、山东滨州、广西北海、山西大同,京东云已经助力多地政府基于现有基础设施本地化部署DeepSeek,既满足本地政务业务,又让当地企业不用投入资源,即可通过政务云调用DeepSeek。


标签: DeepSeek

“全面适配!京东云将DeepSeek推理场景性能提升50%” 的相关文章

华为鸿蒙电脑接入DeepSeek;AI PC产业链加速成熟

华为鸿蒙电脑接入DeepSeek;AI PC产业链加速成熟

在人工智能技术持续迭代的背景下,电子行业正迎来新一轮技术融合与终端创新。华为首款鸿蒙电脑通过接入DeepSeek与盘古大模型,实现了模型与芯片的深度协同;与此同时,AIPC产业链在硬件、生态与市场需求...

中国华能宣布接入DeepSeek

中国华能宣布接入DeepSeek

每经快讯,2月17日,据中国华能官微消息,2月15日,中国华能集团有限公司完成DeepSeek系列模型的本地化部署,推出“睿智小能”AI助手。部署版本包括671B千亿参数级通用大语言模型DeepSee...

多家银行积极部署DeepSeek 涉及多个业务场景

多家银行积极部署DeepSeek 涉及多个业务场景

本报记者 彭妍    银行正加速DeepSeek系列模型本地化部署工作。据记者梳理,目前已有包括国有大行、股份制银行及头部城商行在内的多家银行启动DeepSeek系列模型的本地化部署,应用领域覆盖智能...

deepseek对算力产业的影响具体表现在哪些方面?

deepseek对算力产业的影响具体表现在哪些方面?

时代的列车太快,一不小心就闪了我的老腰。前几天我还信誓旦旦地说:AI只是工具,只是我们未来工作的协作者。没想到打脸来得这么快,Manus横空出世,彻底改变了我的想法。如果说Deepseek是脑,那Ma...

华为鸿蒙电脑接入DeepSeek开启智能办公新纪元

华为鸿蒙电脑接入DeepSeek开启智能办公新纪元

鸿蒙电脑正式登场,开启智能办公新纪元在科技行业备受瞩目的鸿蒙电脑技术与生态沟通会上,一款具有划时代意义的创新产品——鸿蒙电脑正式揭开神秘面纱,惊艳亮相。此次发布会的现场气氛热烈非凡,来自科技领域的专家...

“桥梁+DeepSeek”,上百种桥梁病害一键匹配!技术小白也能轻松使用

“桥梁+DeepSeek”,上百种桥梁病害一键匹配!技术小白也能轻松使用

DeepSeek爆火以来,大家有问题都习惯先问一问,但对特定领域的专业诉求时,其回答往往深度还有欠缺。3月12日,极目新闻记者从中铁大桥局桥科院获悉,其研发的人工智能“桥头堡·智能体”,用户使用这一软...