当前位置：首页 > Deepseek应用场景 > 正文内容

京东云全面适配最新版DeepSeek模型，推理速度提升50%

7个月前 (03-26)Deepseek应用场景486

央广网北京3月26日消息近日，DeepSeek发布了模型更新——DeepSeek-V3-0324，此次升级不仅延续了DeepSeek系列“低成本、高性能”的基因，更凭借 MLA（多头潜在注意力）和 MTP（多Token预测）两大创新技术，将推理速度显著提升。京东云DeepSeek一体机第一时间完成适配，相比开源版本性能大幅提升50%。

单机支持超千并发：单机支持1000+并发请求，总吞吐突破7200 Token/s，可同时服务超大规模企业级AI应用。

极致数据吞吐保障：500并发时仍保持11.03 Token/s，平衡性能与用户体验。

据悉，此次DeepSeek模型更新，通过MLA技术通过将高维特征压缩至低维潜在空间，显著减少计算资源消耗；MTP技术则提升数据利用效率，实现时间维度的资源优化。二者的结合，使得DeepSeek-V3-0324在复杂任务处理中展现出更快的响应速度与更高的稳定性。

京东云DeepSeek一体机通过融合MLA+MTP双技术，为企业提供无缝适配的推理加速方案。此次支持的DeepSeek-V3-0324版本，延续了“单机即可部署满血版模型”的特性，用户无需复杂配置即可运行完整版大模型，满足千人规模企业的并发需求。

同时，京东云DeepSeek一体机还支持华为昇腾、海光等国产AI芯片，兼顾性能与安全自主可控。并通过采用自研算力池化与智能推理加速引擎，软硬协同下推理速度较开源方案提升高达50%。

当前，京东云DeepSeek一体机已广泛应用于政务、金融、科研、能源、医疗、工业、科研等领域。以“推理加速+算力池化”的双重策略，实现同等硬件规格下、同等参数规格下更高效的推理能力和资源利用率，通过将复杂的AI工程化过程封装为标准化产品，让企业无需纠结于“造轮子”，而是聚焦于“用AI创造价值”，更好地进行AI智能化转型。