当前位置:首页 > Deepseek最新资讯 > 正文内容

国泰海通:DeepSeek~V3.1加强智能体支持 与国产AI芯片协同创新

2个月前 (08-27)Deepseek最新资讯190

  发布研报称,DeepSeek V3.1在多项指标上性能大幅领先R1-0528,加强了智能体支持,独创性使用UE8M0 FP8 Scale精度,与国产AI芯片协同创新。DeepSeek-V3.1加强了智能体支持,并且针对下一代国产AI芯片设计;该行维持计算机板块“增持”评级。

  ①混合推理架构,一个模型同时支持思考模式和非思考模式,官方App与网页端模型已同步升级为DeepSeek-V3.1,用户可以通过“深度思考”按钮,实现思考模式和非思考模式自由切换;②更高的思考效率,相比DeepSeek-R1-0528deepseek,DeepSeek-V3.1-Think能在更短时间内给出答案;③更强的Agent能力,通过Post-Training优化,新模型在工具使用与智能体任务中的表现有较大提升。

  ①编程智能体,在代码修复测评SWE与命令行终端环境下的复杂任务(Terminal-Bench)测试中,DeepSeek-V3.1相比之前的DeepSeek系列模型有明显提高。②搜索智能体,DeepSeek-V3.1在多项搜索评测指标上取得了较大提升。在需要多步推理的复杂搜索测试(browsecomp)与多学科专家级难题测试(HLE)上,DeepSeek-V3.1性能已大幅领先R1-0528。③思考效率提升,测试结果显示,经过思维链压缩训练后,V3.1-Think在输出token数减少20%-50%的情况下,各项任务的平均表现与R1-0528持平。同时,V3.1在非思考模式下的输出长度也得到了有效控制,相比于DeepSeek-V3-0324,能够在输出长度明显减少的情况下保持相同的模型性能。

  ①V3.1的Base模型在V3的基础上重新做了外扩训练,一共增加训练了840Btokens。Base模型与后训练模型均已在Hugging face与魔搭开源。②需要注意的是,DeepSeek-V3.1使用了UE8M0 FP8 Scale的参数精度,UE8M0 FP8是针对即将发布的下一代国产芯片设计。③另外,V3.1对分词器及chat template进行了较大调整,与DeepSeek-V3存在明显差异。

  /特朗普:已有人选接替库克,鲍威尔也很快就离开了!美联储首次回应, 库克的律师宣布将起诉......

  /这次没有空中爆炸!1个小时飞越半个地球,马斯克星舰终于成功了,现场欢呼声、鼓掌声响成一片

  /苹果发布会前瞻:iPhone 17—“史上最薄iPhone”,以及苹果硬件发布会的其他预期新品

  /中国石油拟400亿元人民币收购储气库企业:德国汽车欧宝放弃先前电动化战略,延长燃油车型供应时间原文出处:国泰海通:DeepSeek~V3.1加强智能体支持 与国产AI芯片协同创新,感谢原作者,侵权必删!

标签: deepseek

“国泰海通:DeepSeek~V3.1加强智能体支持 与国产AI芯片协同创新” 的相关文章

以自主可控人工智能点亮千行百业,科大讯飞亮相2025世界智能产业博览会

以自主可控人工智能点亮千行百业,科大讯飞亮相2025世界智能产业博览会

  9月5日,2025世界智能产业博览会(以下简称“智博会”)在重庆开幕。本届智博会由重庆市人民政府和天津市人民政府共同主办,聚焦“人工智能+”和“智能网联新能源汽车”主题,吸引600余家...

DeepSeek透露下一代国产芯片即将发布,半导体ETF半日大涨5.89%

DeepSeek透露下一代国产芯片即将发布,半导体ETF半日大涨5.89%

  AI应用落地正在加速,从算法突破向产业链传导的趋势更加明确,尤其在算力需求扩张背景下,带动对半导体设备的投资预期显著增强。   8月22日上午收盘,市场早盘震荡走高,...

DeepSeek预测:美因茨vs多特蒙德!吉拉西火力全开,大黄蜂客场碾压?

DeepSeek预测:美因茨vs多特蒙德!吉拉西火力全开,大黄蜂客场碾压?

  德甲第5轮即将迎来一场焦点战,美因茨将在主场迎战多特蒙德。目前多特蒙德状态火热,而美因茨则略显挣扎。本场比赛能否成为一场进球盛宴?让我们深入分析。   多特蒙德目前以...

DeepSeek预测:AC米兰VS佛罗伦萨,红黑军团主场碾压紫百合,普利西奇再创

DeepSeek预测:AC米兰VS佛罗伦萨,红黑军团主场碾压紫百合,普利西奇再创

  意甲第7轮即将迎来一场焦点战,AC米兰坐镇圣西罗迎战佛罗伦萨。目前AC米兰以4胜1平1负积13分排名第3,而佛罗伦萨则0胜3平3负积3分排名第17,深陷降级区。本场比赛对于双方来说都至...

大禹节水:成功部署DeepSeek系列大模型

大禹节水:成功部署DeepSeek系列大模型

  公司目前经营状况如何?股价跌了一个多月,有没有市值管理准备?雅下水电站合同签了多少?人工智能Ai方面有什么动作进展?投资者您好,公司目前紧扣国家加大水利建设投资力度的大趋势,深入推进转...

DeepSeek开源OCR新模型!单张A100日处理可超20万页数据

DeepSeek开源OCR新模型!单张A100日处理可超20万页数据

  简单来看,团队的思路是,既然一张图就能包含大量文字信息,同时用的 Token 更少,那就可以将文本转成图像,这就是题目中提到的“光学压缩”,用视觉模态压缩文本信息。这一结果显示出该方法...