当前位置:首页 > Deepseek应用场景 > 正文内容

英伟达宣布创造满血 DeepSeek 推理世界记录

3个月前 (03-19)Deepseek应用场景180

IT之家 3 月 19 日消息,英伟达在今日举行的 NVIDIA GTC 2025 上宣布其 NVIDIA Blackwell DGX 系统创下 DeepSeek-R1 大模型推理性能的世界纪录。

据介绍,在搭载了八块 Blackwell GPU 的单个 DGX 系统上运行 6710 亿参数的满血 DeepSeek-R1 模型可实现每用户每秒超 250 token 的响应速度,系统最高吞吐量突破每秒 3 万 token。

英伟达表示,随着 NVIDIA 平台继续在最新的 Blackwell Ultra GPU 和 Blackwell GPU 上突破推理极限,其性能将会继续不断提高。

▲ 运行 TensorRT-LLM 软件的 NVL8 配置的 NVIDIA B200 GPU

单节点配置:DGX B200(8 块 GPU)与 DGX H200(8 块 GPU)

测试参数:最新测试采用 TensorRT-LLM 内部版本,输入 1024 token / 输出 2048 token;此前测试为输入 / 输出各 1024 token

计算精度:B200 采用 FP4,H100 / H200 采用 FP8 精度

英伟达表示,通过硬件和软件的结合,他们自 2025 年 1 月以来成功将 DeepSeek-R1 671B 模型的吞吐量提高了约 36 倍。

节点配置:DGX B200(8 块 GPU)、DGX H200(8 块 GPU)、两个 DGX H100(8 块 GPU)系统

测试参数:依然采用 TensorRT-LLM 内部版本,输入 1024 token / 输出 2048 token;此前测试为输入 / 输出各 1024 token;并发性 MAX

计算精度:B200 采用 FP4,H100 / H200 采用 FP8 精度

与 Hopper 架构相比,Blackwell 架构与 TensorRT 软件相结合可实现显著的推理性能提升。

英伟达表示,包括 DeepSeek-R1、Llama 3.1 405B 和 Llama 3.3 70B,运行 TensorRT 软件并使用 FP4 精度的 DGX B200 平台与 DGX H200 平台相比已经提供了 3 倍以上的推理吞吐量提升。

英伟达表示,在对模型进行量化以利用低精度计算优势时,确保精度损失最小化是生产部署的关键。IT之家注意到,在 DeepSeek-R1 模型上,相较于 FP8 基准精度,TensorRT Model Optimizer 的 FP4 训练后量化(PTQ)技术在不同数据集上仅产生微乎其微的精度损失。


“英伟达宣布创造满血 DeepSeek 推理世界记录” 的相关文章

三大领域落地应用 陆金所控股完成DeepSeek接入

三大领域落地应用 陆金所控股完成DeepSeek接入

DeepSeek凭借其开源、低成本、高性能等优势,掀起人工智能领域的新一轮热潮。作为平安集团金融科技生态圈的重要组成部分,陆金所控股(LU.US;6623.HK)近日已完成DeepSeek的接入。通过...

让DeepSeek更有趣更有深度的思考研究分析报告

让DeepSeek更有趣更有深度的思考研究分析报告

01摘要DeepSeek能生成文章、改写文本、总结归纳长文档中的关键信息。不管是写博客、论文还是产品介绍,它都能帮上忙。你写东西的时候,有个“智能助手”帮你梳理思路、润色语言,是不是效率直接拉满?De...

托普云农:目前暂无与DeepSeek合作计划

托普云农:目前暂无与DeepSeek合作计划

每经AI快讯,托普云农(301556)2月24日在互动平台表示,公司一直积极关注行业内的技术发展,但目前暂无与DeepSeek合作计划。未来,公司将持续深耕智慧农业行业,提升技术水平,在农业大数据分析...

华南理工大学上线满血版DeepSeek!面向省内院校开放

华南理工大学上线满血版DeepSeek!面向省内院校开放

好消息!新学期即将开始华南理工大学本地化部署的满血版DeepSeek-R1正式上线!为进一步培养师生AI思维和使用AI的能力华南理工大学基于学校“成务”科学计算平台成功完成满血版DeepSeek-R1...

双良节能全面启动DeepSeek全场景应用 以AI驱动产业升级

双良节能全面启动DeepSeek全场景应用 以AI驱动产业升级

2月17日,双良节能全面启动DeepSeek全产业全场景应用计划。基于DeepSeek-R1大模型的高效推理能力与成本优势,通过本地化部署实现AI与业务的深度耦合,双良将在智能制造、清洁能源等核心产业...

赋能制造业 高明建立DeepSeek本地化服务平台

赋能制造业 高明建立DeepSeek本地化服务平台

4月28日上午,由佛山市高明区经济和科技促进局、高明区政务服务和数据管理局、高明区工商业联合会联合主办的“2025年高明区数字化转型与AI应用创新发展大会”召开。大会以“数启新程、智创未来”为主题,汇...