当前位置:首页 > Deepseek应用场景 > 正文内容

比肩 H100!硅基流动上线基于昇腾云 CloudMatrix 超节点的 DeepSeek-R1

7个月前 (04-11)Deepseek应用场景405

近日,硅基流动创始人袁进辉在华为云生态大会上宣布,硅基流动联合华为云基于 CloudMatrix 384超节点昇腾云服务和高性能推理框架 SiliconLLM,用大规模专家并行最佳实践正式上线 DeepSeek-R1。

该服务在保证单用户 20 TPS水平前提下,单卡 Decode吞吐突破 1920 Tokens/s,可比肩 H100 部署性能。同时,经过主流测试集验证及大规模线上盲测,在昇腾算力部署 DeepSeek-R1的模型精度与 DeepSeek官方保持一致。


其中,通过架构的全面创新,基于新型高速总线架构的 CloudMatrix超节点集群在总算力、互联带宽、内存带宽上领先业界。

此前,硅基流动在大模型云服务平台 SiliconCloud首发推出了基于昇腾云的稳定生产级 DeepSeek-V3 & R1 推理服务,并支持模型私有化集群部署,这次合作推动基于国产算力的 DeepSeek-R1推理服务持续升级。


DeepSeek风暴席卷全球,特别是以其高效、低成本的 MoE架构为应对大模型推理挑战打开了局面。不过,如果没有强大的 AI Infra 技术能力,要想部署好 DeepSeek并非易事。

DeepSeek使用了大规模专家并行(Expert Parallelism,大 EP并行)的 MoE模型架构,若采用单机部署方案,最终的性能远不如 DeepSeek官方公布的部署方案,且至少有数倍成本差距。更具挑战的是,虽然 DeepSeek公开了大 EP 并行方案,但技术难度较大,业内还没有其他团队快速复现这一部署方法。

针对这些难题,硅基流动与华为云联合攻关实现了技术突破。我们在 CloudMatrix 384超节点昇腾云服务上部署 DeepSeek-R1 时采纳了大规模专家并行方案,通过多专家负载均衡和极致通信优化,实现高吞吐及更高性能,大幅提升了用户体验。同时,我们使用昇腾高性能算子库,以及硅基流动推理加速框架 SiliconLLM在模型、机制、算子上的协同优化,实现在国产算力上,不损失模型精度的情况下,获得 DeepSeek-R1 推理效率与资源利用率的显著提升。

硅基流动与华为云的合作不仅提供坚实的全国产软硬件体系部署方案,让 DeepSeek推理服务更经济高效,也展现了 AI 生态合作的强大能量。硅基流动将继续加深与华为云的联合创新,共同提升产品体验,加速模型在更多场景落地。


“比肩 H100!硅基流动上线基于昇腾云 CloudMatrix 超节点的 DeepSeek-R1” 的相关文章

中国华能宣布接入DeepSeek

中国华能宣布接入DeepSeek

每经快讯,2月17日,据中国华能官微消息,2月15日,中国华能集团有限公司完成DeepSeek系列模型的本地化部署,推出“睿智小能”AI助手。部署版本包括671B千亿参数级通用大语言模型DeepSee...

2025全国DeepSeek数字应用实训营在临沂市举办

2025全国DeepSeek数字应用实训营在临沂市举办

4月26日,由临沂市融媒体中心琅琊新闻网主办,DeepSeek技术联盟与量子光年工作室联合协办的“2025全国DeepSeek数字应用实训营(临沂站)”圆满落幕。活动吸引了来自金融、电力、党政机关、事...

DeepSeek于知乎开设官方账号

DeepSeek于知乎开设官方账号

3月1日,DeepSeek于知乎开设官方账号,发布《DeepSeek-V3/R1推理系统概览》技术文章,首次公布模型推理系统优化细节,并披露成本利润率关键信息。文章写道:“DeepSeek-V3/R1...

捷停车上线“DeepSeek停车助手”,车场车位“一问”直达

捷停车上线“DeepSeek停车助手”,车场车位“一问”直达

最近,越来越多车主发现,打开捷停车小程序首页,可以直接让AI帮忙找场找位,甚至还能问它现场能不能充电、购买停车套餐等。目前,DeepSeek停车助手已在捷停车微信小程序正式上线,面向平台车主开放体验,...

数坤科技、华为联手!助力深圳市人民医院完成DeepSeek本地化部署

数坤科技、华为联手!助力深圳市人民医院完成DeepSeek本地化部署

近日,深圳市人民医院、数坤科技与华为三方达成深度合作,实现了DeepSeek-R1模型及“数坤坤”多模态医疗健康大模型的院内部署,并共同打造基于医疗专业大模型的数智医院建设整体解决方案,将为医院的医疗...

四地联动|“院士天团”热议DeepSeek,为城市发展支招

四地联动|“院士天团”热议DeepSeek,为城市发展支招

随着DeepSeek爆红全球,“人工智能”毫不意外成为今年两会的热门关键词之一。2025年全国两会,政府工作报告再次提出推进“人工智能+”行动,但与去年相比,篇幅明显增加,并且部署更为细化。未来人工智...