当前位置:首页 > Deepseek最新资讯 > 正文内容

Deepseek R1 推理实测:4 块英伟达 GB300 能干 16 块 H1

2个月前 (08-27)Deepseek最新资讯235

  IT之家援引博文介绍,CoreWeave 使用 Deepseek R1 推理模型,对比评估英伟达 Blackwell 架构 GB300 NVL72 和上一代 H100 GPU 的差别。归功于英伟达升级架构,增强内存和带宽,测试结果显示,GB300 在仅使用 4 块 GPU 的情况下,即可完成原本需要 16 块 H100 才能运行的任务。

  GB300 NVL72 平台支持高达 37TB 的内存容量(最高可达 40TB),并配备每秒 130TB 的内存带宽。该平台为减少 GPU 间数据分割次数deepseek,采用 4 路并行设计,并通过 NVLink 和 NVSwitch 高速互连提升通信效率。

  CoreWeave 指出,这不仅是 FLOPs 算力的提升,更是系统架构在实际业务场景下的效率跃迁。对于需要运行复杂模型的企业客户,GB300 NVL72 提供了更高的扩展性和更低的延迟,帮助他们更快、更经济地部署和运行 AI 服务。原文出处:Deepseek R1 推理实测:4 块英伟达 GB300 能干 16 块 H100 的活,感谢原作者,侵权必删!

标签: deepseek

“Deepseek R1 推理实测:4 块英伟达 GB300 能干 16 块 H1” 的相关文章

每日互动方毅2025数博会分享:用二十年数据智能实践,走出AI落地新路径

每日互动方毅2025数博会分享:用二十年数据智能实践,走出AI落地新路径

  8月28日,2025中国国际大数据产业博览会在贵阳隆重开幕。当天下午,在国家数据局主办的数据产业创新发展主题交流活动中,每日互动董事长兼总经理方毅受邀发表《无数不智:让AI把私有数据用...

抖音、微信、DeepSeek集体出手!

抖音、微信、DeepSeek集体出手!

  据抖音集团公众号9月1日消息,2025年9月,抖音发布《抖音关于升级AI内容标识功能的公告》,协助创作者理解抖音AI内容标识规则,通过AI内容标识提醒用户辨别虚假信息,维护抖音用户及创...

DeepSeek与智谱将发布新模型

DeepSeek与智谱将发布新模型

  9月29日,AI从业者发现DeepSeek-V3.2新模型已被上传至社区平台HuggingFace,随后被删除。另外,记者了解到deepseek,智谱新模型GLM-4.6也将于近日发布...

奥特曼:来自DeepSeek和Kimi等中国大模型的竞争加速了OpenAI开源

奥特曼:来自DeepSeek和Kimi等中国大模型的竞争加速了OpenAI开源

  OpenAI创始人山姆·奥特曼日前接受采访时表示,来自中国模型的竞争,尤其像DeepSeek和Kimi K2这样的模型,是OpenAI最近决定发布开源模型的因素,他认为在推理能力方面d...

QuestMobile:2025年6月DeepSeek月活降至1629.5万

QuestMobile:2025年6月DeepSeek月活降至1629.5万

  QuestMobile数据显示,其月活跃用户规模从2025年3月的1936.1万降至6月的1629.5万,下滑趋势明显。   而对5月流失用户的追踪揭示了他们的去向:...

盘后,DeepSeek,传出重磅消息!

盘后,DeepSeek,传出重磅消息!

  今日(9月4日)盘后,有消息称,中国AI公司DeepSeek正在开发具有更先进代理功能的人工智能AI模型,意在与OpenAI等竞争对手在技术新前沿展开竞争。报道称,DeepSeek创始...