当前位置:首页 > Deepseek最新资讯 > 正文内容

英特尔 Gaudi 2E AI 宣布为 DeepSeek V3.1 提供加速支持

2个月前 (08-27)Deepseek最新资讯272

  IT之家查询获悉,英特尔 Gaudi 2E 采用 7nm 制程,配备 96GB HBM2E 内存、48MB SRAM,具备 2.4TB 总内存带宽,针对随机访问deepseek、线性访问场景进行深度优化,有效避免了 AI 训练或推理任务的延迟。

  英特尔表示,Gaudi 2E 具备 24 个完全可编程的张量处理器核心(TPC)、2 个矩阵乘法引擎(MME),拥有卓越的可扩展能力,提供 24 个 100 GbE 端口,支持多卡互联,为用户提供了灵活的、可定制化的解决方案,满足其不断变化的 AI 需求。

  英特尔表示,实测数据显示,在英特尔 Gaudi 2E 的支持下,DeepSeek-V3.1 无论是在问答还是编码上,能力都有着显著提升:

  在输入 / 输出 token 长度均为 2k、多用户并发数为 28 的条件下,每个并发 token 生成速率达到每秒 10 token。原文出处:英特尔 Gaudi 2E AI 宣布为 DeepSeek V3.1 提供加速支持,问答编码能力都有显著提升,感谢原作者,侵权必删!

标签: deepseek

“英特尔 Gaudi 2E AI 宣布为 DeepSeek V3.1 提供加速支持” 的相关文章

中国联通精彩亮相2025世界VR产业大会 全景展示AI+VR融合创新成果

中国联通精彩亮相2025世界VR产业大会 全景展示AI+VR融合创新成果

  10月19日至20日,2025世界VR产业大会在江西南昌举行,来自全球VR领域的专家学者、领军企业和业界精英齐聚南昌,共同探讨VR与AI融合发展的新趋势,中国联通副总经理王利民出席开幕...

DeepSeek、GPT-5带头转向混合推理,一个token也不能浪费

DeepSeek、GPT-5带头转向混合推理,一个token也不能浪费

  在最近的一档脱口秀节目中,演员张俊调侃 DeepSeek 是一款非常「内耗」的 AI,连个「1 加 1 等于几」都要斟酌半天。   在 AI 领域,这种情况被称为「过...

道曼想效仿赖斯用屁股停球,结果阿尔特塔一拳将球拍走

道曼想效仿赖斯用屁股停球,结果阿尔特塔一拳将球拍走

  主要是虎扑前一个推送王楚琪那个说道曼的帖子,就有人招黑了,这里立马又来一个道曼的帖子,所以才这么说。   主要是虎扑前一个推送王楚琪那个说道曼的帖子,就有人招黑了,这...

[流言板]硬核回归!45岁中国乒坛名将加盟波兰俱乐部,出战欧冠联赛

[流言板]硬核回归!45岁中国乒坛名将加盟波兰俱乐部,出战欧冠联赛

  虎扑07月31日讯 近日,45岁中国乒坛名将侯英超加盟波兰Dekorglass俱乐部,将出战新赛季欧冠联赛。   这位曾两夺全锦赛男单冠军(2000年、2019年)的...

浪潮信息发布“元脑SD200”超节点,面向万亿参数大模型创新设计

浪潮信息发布“元脑SD200”超节点,面向万亿参数大模型创新设计

  当前,开源模型正取得飞跃式进步,推动研发范式从封闭走向开放协作deepseek。随着大模型参数量的持续提升,对算力基础设施的建设提出了更高要求。8月7日,浪潮信息发布面向万亿参数大模型...

冗长响应缩减80%,DeepSeek GRPO获得颠覆性改进,微软GFPO问世

冗长响应缩减80%,DeepSeek GRPO获得颠覆性改进,微软GFPO问世

  用过 DeepSeek-R1 等推理模型的人,大概都遇到过这种情况:一个稍微棘手的问题,模型像陷入沉思一样长篇大论地推下去,耗时耗算力,结果却未必靠谱。现在,我们或许有了解决方案。...