当前位置:首页 > Deepseek最新资讯 > 正文内容

报道:DeepSeek决定使用华为人工智能芯片训练部分模型

2个月前 (08-30)Deepseek最新资讯173

  观点网讯:8月29日,据媒体报道,DeepSeek已决定使用华为的人工智能芯片来训练其部分模型,反映其正在减少对英伟达芯片的依赖。

  DeepSeek方面称,本次升级包含以下主要变化:混合推理架构让一个模型同时支持思考模式与非思考模式;相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短时间内给出答案,让模型拥有更高的思考效率;通过Post-Training优化,让新模型有更强的Agent能力,在工具使用与智能体任务中的表现有较大提升。

  据悉,DeepSeek-V3.1采用了UE8MO FP8 Scale参数精度,该模型与UE8M0FP8动态范围大,提升稳定性与效率,适配华为昇腾等芯片deepseek。原文出处:报道:DeepSeek决定使用华为人工智能芯片训练部分模型,感谢原作者,侵权必删!

标签: deepseek

“报道:DeepSeek决定使用华为人工智能芯片训练部分模型” 的相关文章

DeepSeek率先响应AI标识新规,筑牢技术伦理防线

DeepSeek率先响应AI标识新规,筑牢技术伦理防线

  随着《人工智能生成合成内容标识办法》及配套国家标准于2025年9月1日正式实施,我国AI内容治理进入规范化新阶段。在这场关乎技术伦理与公共安全的制度建设中,DeepSeek公司率先发布...

智谱、DeepSeek大模型密集上新 华为寒武纪芯片火速适配,国产AI生态加速“

智谱、DeepSeek大模型密集上新 华为寒武纪芯片火速适配,国产AI生态加速“

  值得一提的是,智谱官宣GLM-4.6在寒武纪国产芯片实现FP8+Int4混合量化部署,为首套投产的该模式芯片一体方案,其基于vLLM框架,还可在摩尔线程新一代GPU原生FP8精度稳定运...

杭钢股份涨停,DeepSeek-R2刺激算力需求+东数西算概念

杭钢股份涨停,DeepSeek-R2刺激算力需求+东数西算概念

  截至9时59分,杭钢股份涨幅为9.98%,最新价9.81元,总市值331.30亿元deepseek,封板资金5.92亿元,成交额16.59亿元,换手率5.21%,所属行业为钢铁行业。...

DeepSeek新模型让AI成本砍半!长文本处理效率暴增的秘密在这

DeepSeek新模型让AI成本砍半!长文本处理效率暴增的秘密在这

  今天早上七点多,我正刷着牙呢,手机突然弹出一条消息:DeepSeek发布全新V3.2-Exp模型。本来以为又是哪个公司在吹牛皮,结果点开一看,我牙刷差点掉洗手池里——这玩意儿不仅性能更...

百度计划8月底前发布AI推理新模型,未来几个月推出文心5.0,使其与DeepSe

百度计划8月底前发布AI推理新模型,未来几个月推出文心5.0,使其与DeepSe

  ,该模型能够处理更复杂的任务,以在与 DeepSeek 和 OpenAI 等公司的竞争中占据一席之地。   报道还称,百度还计划在未来几个月推出其核心基础模型的更新版...

【华西计算机】0930 DeepSeek-V3.2-Exp模型正式发布并开源

【华西计算机】0930 DeepSeek-V3.2-Exp模型正式发布并开源

  架构,这种架构能够有效降低计算资源消耗并提升模型推理效率。目前,该模型已正式上架华为云大模型即服务平台   蚂蚁集团推出开源自研的首个万亿参数大模型Ring-1T-p...