当前位置:首页 > Deepseek最新资讯 > 正文内容

Deepseek R1 推理实测:4 块英伟达 GB300 能干 16 块 H1

2周前 (08-27)Deepseek最新资讯116

  IT之家援引博文介绍,CoreWeave 使用 Deepseek R1 推理模型,对比评估英伟达 Blackwell 架构 GB300 NVL72 和上一代 H100 GPU 的差别。归功于英伟达升级架构,增强内存和带宽,测试结果显示,GB300 在仅使用 4 块 GPU 的情况下,即可完成原本需要 16 块 H100 才能运行的任务。

  GB300 NVL72 平台支持高达 37TB 的内存容量(最高可达 40TB),并配备每秒 130TB 的内存带宽。该平台为减少 GPU 间数据分割次数deepseek,采用 4 路并行设计,并通过 NVLink 和 NVSwitch 高速互连提升通信效率。

  CoreWeave 指出,这不仅是 FLOPs 算力的提升,更是系统架构在实际业务场景下的效率跃迁。对于需要运行复杂模型的企业客户,GB300 NVL72 提供了更高的扩展性和更低的延迟,帮助他们更快、更经济地部署和运行 AI 服务。原文出处:Deepseek R1 推理实测:4 块英伟达 GB300 能干 16 块 H100 的活,感谢原作者,侵权必删!

标签: deepseek

“Deepseek R1 推理实测:4 块英伟达 GB300 能干 16 块 H1” 的相关文章

工信部:DeepSeek、通义千问等国产大模型引领全球开源创新生态

工信部:DeepSeek、通义千问等国产大模型引领全球开源创新生态

  【工信部:DeepSeek、通义千问等#国产大模型引领全球开源创新生态#】据中国网,工信部副部长张云明在国新办新闻发布会上表示,“十四五”期间,我国人工智能企业数量和产业规模持续增长,...

迈向智能体时代“第一步” DeepSeek-V3.1 发布

迈向智能体时代“第一步” DeepSeek-V3.1 发布

  新京报贝壳财经讯(记者罗亦丹)8月21日,DeepSeek在官方公号发文称deepseek,正式发布DeepSeek-V3.1。本次升级包含以下主要变化:一个模型同时支持思考模式与非思...

对话联合国首席信息技术官:DeepSeek是“伟大的进化”

对话联合国首席信息技术官:DeepSeek是“伟大的进化”

  #全球财经连线#【对话联合国首席信息技术官:DeepSeek是“伟大的进化”】“DeepSeek(比其他大模型)便宜很多,但仍然很强大,它彻底改变了大模型在计算能力方面的构想,这是一次...

站在DeepSeek肩膀上,小红书开源首款多模态模型:看懂表情包与数学题,一手实

站在DeepSeek肩膀上,小红书开源首款多模态模型:看懂表情包与数学题,一手实

  智东西8月7日报道,昨天,小红书hi lab(人文智能实验室)开源了其首款多模态大模型dots.vlm1,这一模型基于DeepSeek V3打造,并配备了由小红书自研的12亿参数视觉编...

津门数智跃迁:华为深度携手天津打造中国新质生产力“城市样板”

津门数智跃迁:华为深度携手天津打造中国新质生产力“城市样板”

  2025年上半年,天津所给出的经济“年中成绩单”中,“新质生产力加速形成,即规模以上高技术制造业增加值占比达16.4%,发展含‘新’量、含‘科’量显著增强。”引发业界高度关注。这一亮眼...

为什么DeepSeek从年初“国运级”到现在热度减退,问题出在哪里?

为什么DeepSeek从年初“国运级”到现在热度减退,问题出在哪里?

  DeepSeek从年初的“国运级”到现在的热度减退,到底哪里出问题了?有网友表示,Deepseek 并没有无人问津,依然每天有大量的活跃用户。但提问者依然觉得Deepseek的热度和年...