当前位置:首页 > Deepseek应用场景 > 正文内容

京东云全面适配最新版DeepSeek模型,推理速度提升50%

1个月前 (03-26)Deepseek应用场景130

央广网北京3月26日消息 近日,DeepSeek发布了模型更新——DeepSeek-V3-0324,此次升级不仅延续了DeepSeek系列“低成本、高性能”的基因,更凭借 MLA(多头潜在注意力)和 MTP(多Token预测)两大创新技术,将推理速度显著提升。京东云DeepSeek一体机第一时间完成适配,相比开源版本性能大幅提升50%。

单机支持超千并发:单机支持1000+并发请求,总吞吐突破7200 Token/s,可同时服务超大规模企业级AI应用。

极致数据吞吐保障:500并发时仍保持11.03 Token/s,平衡性能与用户体验。

据悉,此次DeepSeek模型更新,通过MLA技术通过将高维特征压缩至低维潜在空间,显著减少计算资源消耗;MTP技术则提升数据利用效率,实现时间维度的资源优化。二者的结合,使得DeepSeek-V3-0324在复杂任务处理中展现出更快的响应速度与更高的稳定性。

京东云DeepSeek一体机通过融合MLA+MTP双技术,为企业提供无缝适配的推理加速方案。此次支持的DeepSeek-V3-0324版本,延续了“单机即可部署满血版模型”的特性,用户无需复杂配置即可运行完整版大模型,满足千人规模企业的并发需求。

同时,京东云DeepSeek一体机还支持华为昇腾、海光等国产AI芯片,兼顾性能与安全自主可控。并通过采用自研算力池化与智能推理加速引擎,软硬协同下推理速度较开源方案提升高达50%。

当前,京东云DeepSeek一体机已广泛应用于政务、金融、科研、能源、医疗、工业、科研等领域。以“推理加速+算力池化”的双重策略,实现同等硬件规格下、同等参数规格下更高效的推理能力和资源利用率,通过将复杂的AI工程化过程封装为标准化产品,让企业无需纠结于“造轮子”,而是聚焦于“用AI创造价值”,更好地进行AI智能化转型。


“京东云全面适配最新版DeepSeek模型,推理速度提升50%” 的相关文章

新华网:可提供基于Deepseek模型的训练推理服务

新华网:可提供基于Deepseek模型的训练推理服务

金融界3月26日消息,有投资者在互动平台向新华网提问:Deepseek释放了算力需求,贵公司算力情况如何?公司回答表示:新华AIGC应用使能平台的高弹性算力包产品,可以为客户提供低成本普惠的算力资源,...

金台区法院开展“DeepSeek”应用专题培训会

金台区法院开展“DeepSeek”应用专题培训会

为进一步激发干警获取新技术、新应用的热情,提高运用人工智能辅助司法工作的能力。4月9日下午,金台区法院组织召开主题为“如何用好DeepSeek为工作提质增效”应用专题培训会。讲座由院党组副书记、副院长...

创力集团:正在积极探索设备接入DeepSeek相关技术或平台

创力集团:正在积极探索设备接入DeepSeek相关技术或平台

e公司讯,创力集团(603012)2月18日在互动平台表示,公司正在积极探索设备接入DeepSeek相关技术或平台。公司研发团队在AI算法优化、数据处理及自动化控制等领域有丰富经验,利用DeepSee...

DeepSeek宣布开源优化并行策略

DeepSeek宣布开源优化并行策略

Deepseek于开源周第四天宣布开源优化并行策略,其中DualPipe——包括一种用于V3/R1训练中计算-通信重叠的双向管道并行算法;EPLB——一种用于V3/R1的专家并行负载平衡器;以及分析V...

DeepSeek V3升级版发布:编程数学能力接近Claude 3.7

DeepSeek V3升级版发布:编程数学能力接近Claude 3.7

DeepSeek于24日夜间发布V3模型小版本升级,新版本DeepSeek-V3-0324在模型参数上达到685B,并采用MIT许可证,为用户带来全新体验。该版本重点提升了数学和编程能力,性能接近Cl...

DeepSeek接入政务系统,公务员要下岗了?

DeepSeek接入政务系统,公务员要下岗了?

最近,全国多地将DeepSeek等人工智能系统应用于政务和公共服务。基于DeepSeek系统的“AI公务员”在深圳福田区上岗,在多类场景“办公”。广州市政务服务和数据管理局在政务外网正式部署上线Dee...