当前位置:首页 > Deepseek应用场景 > 正文内容

英伟达宣布创造满血 DeepSeek 推理世界记录

5个月前 (03-19)Deepseek应用场景261

IT之家 3 月 19 日消息,英伟达在今日举行的 NVIDIA GTC 2025 上宣布其 NVIDIA Blackwell DGX 系统创下 DeepSeek-R1 大模型推理性能的世界纪录。

据介绍,在搭载了八块 Blackwell GPU 的单个 DGX 系统上运行 6710 亿参数的满血 DeepSeek-R1 模型可实现每用户每秒超 250 token 的响应速度,系统最高吞吐量突破每秒 3 万 token。

英伟达表示,随着 NVIDIA 平台继续在最新的 Blackwell Ultra GPU 和 Blackwell GPU 上突破推理极限,其性能将会继续不断提高。

▲ 运行 TensorRT-LLM 软件的 NVL8 配置的 NVIDIA B200 GPU

单节点配置:DGX B200(8 块 GPU)与 DGX H200(8 块 GPU)

测试参数:最新测试采用 TensorRT-LLM 内部版本,输入 1024 token / 输出 2048 token;此前测试为输入 / 输出各 1024 token

计算精度:B200 采用 FP4,H100 / H200 采用 FP8 精度

英伟达表示,通过硬件和软件的结合,他们自 2025 年 1 月以来成功将 DeepSeek-R1 671B 模型的吞吐量提高了约 36 倍。

节点配置:DGX B200(8 块 GPU)、DGX H200(8 块 GPU)、两个 DGX H100(8 块 GPU)系统

测试参数:依然采用 TensorRT-LLM 内部版本,输入 1024 token / 输出 2048 token;此前测试为输入 / 输出各 1024 token;并发性 MAX

计算精度:B200 采用 FP4,H100 / H200 采用 FP8 精度

与 Hopper 架构相比,Blackwell 架构与 TensorRT 软件相结合可实现显著的推理性能提升。

英伟达表示,包括 DeepSeek-R1、Llama 3.1 405B 和 Llama 3.3 70B,运行 TensorRT 软件并使用 FP4 精度的 DGX B200 平台与 DGX H200 平台相比已经提供了 3 倍以上的推理吞吐量提升。

英伟达表示,在对模型进行量化以利用低精度计算优势时,确保精度损失最小化是生产部署的关键。IT之家注意到,在 DeepSeek-R1 模型上,相较于 FP8 基准精度,TensorRT Model Optimizer 的 FP4 训练后量化(PTQ)技术在不同数据集上仅产生微乎其微的精度损失。


“英伟达宣布创造满血 DeepSeek 推理世界记录” 的相关文章

一份DeepSeek概念股一览表,涵盖了多个行业和领域的上市公司

一份DeepSeek概念股一览表,涵盖了多个行业和领域的上市公司

以下是一份DeepSeek概念股一览表,涵盖了多个行业和领域的上市公司:行业/领域 股票代码 公司名称电子元件 300657 弘信电子通信设备 688080 映翰通半导体 688620 安凯微6880...

科技伦理视域下DeepSeek的学术风险及其防范

科技伦理视域下DeepSeek的学术风险及其防范

作者:刘科(河南师范大学科技与社会研究所教授);贾豫政(河南师范大学科技与社会研究所助理研究员)近期,人们对DeepSeek(深度求索)的热议揭示了人机关系的复杂性,也凸显了在AI领域嵌入科技伦理的必...

《数势科技黎科峰博士:Agent接入DeepSeek,将帮助企业打通数据应用最后一公里》

《数势科技黎科峰博士:Agent接入DeepSeek,将帮助企业打通数据应用最后一公里》

近日,数势科技创始人兼 CEO 黎科峰博士出席由知名科技媒体InfoQ 策划的 DeepSeek 系列直播系列节目。在直播中,极客邦科技创始人  &CEO 霍太稳对话黎科峰博士,深入探讨了回归...

腾讯搭上DeepSeek快车发力C端,字节、阿里、百度还坐得住?

腾讯搭上DeepSeek快车发力C端,字节、阿里、百度还坐得住?

文|萧俊然 编|张弘一出品|商业秀2月15日晚,科技圈又抛出一颗重磅炸弹:微信正在灰度测试接入DeepSeek-R1模型 。不少已经获得测试资格的用户,纷纷晒出体验。16日上午,腾讯方面回应称,确认正...

最新的DeepSeek更新了 有网友对新版R1模型进行了测试

最新的DeepSeek更新了 有网友对新版R1模型进行了测试

5月28日,DeepSeek在官方交流群中公布,DeepSeek R1模型已完成小版本试升级。用户可在官方网页、APP、小程序测试(打开深度思考),API接口和使用方式保持不变。DeepSeek在开源...

华自科技:公司水利水电智能运维大模型已完成DeepSeek全面接入

华自科技:公司水利水电智能运维大模型已完成DeepSeek全面接入

每经AI快讯,华自科技3月7日在互动平台表示,公司“共工”水利水电智能运维大模型已完成DeepSeek全面接入,将焕新升级“智能交互、数据驱动、深度思考、主动服务”四大核心能力,以AI深度协同赋能水利...