当前位置:首页 > Deepseek最新资讯 > 正文内容

叫板OpenAI,DeepSeek-V3.1正式发布

6小时前Deepseek最新资讯21

  8月21日,DeepSeek 正式发布 V3.1版本,并将其称为“迈向 Agent 时代的*步”。与以往的大模型迭代不同,它*的特征是混合推理架构,一个模型同时支持思考模式与非思考模式。这意味着模型在保持性能稳定的同时,能够根据需求选择是快速给出答案,还是展开更长链路的推理。

  更重要的是,经过思维链压缩训练,新版模型在生成结果时的token数量减少了20%至50%(同前代模型DeepSeek-R1-0528相比),这不仅带来响应速度的提升,也直接降低了使用成本。

  配合128K的上下文扩展和FP8精度推理,V3.1在工程层面强化了吞吐效率与能耗表现,为大规模应用打下基础。

  除了推理效率上的改进,V3.1在智能体能力上的进化尤为关键。官方测试显示,在代码修复和命令行任务等编程智能体场景中,新模型展现出更强的执行力和稳定性,能够在真实环境中完成多轮迭代修正,避免“越改越乱”的问题。

  在复杂搜索任务上,V3.1则展现了更成熟的检索与整合能力,它可以规划搜索步骤、筛选证据并综合多源信息,在高难度的多学科题目测试中,性能已经远超前代模型。

  在商业与生态层面,DeepSeek 选择了“双轨”策略deepseek,一方面继续提供 API 服务,但将于9月6日起调整价格并取消夜间优惠;另一方面,V3.1的Base模型与后训练版本已在Hugging Face和魔搭同步开源。

  值得一提的是,在这一次的官方发布说明中,DeepSeek提到“V3.1使用了 UE8M0 FP8 Scale的参数精度”,更为通俗的说,它设置了一个适配于即将发布的新一代国产芯片的技术规范与设计标准。“建议有部署需求的用户仔细阅读新版说明文档。”而在此之前,国产芯片部署DeepSeek通常会有一定性能减弱,除非再做专门的软件适配。

  本次DeepSeek-V3.1的发布也似有与GPT5对垒的意味,都支持超长上下文,都有更强的复杂任务处理能力,基础模型调用更为灵活,成本更为弹性。原文出处:叫板OpenAI,DeepSeek-V3.1正式发布,感谢原作者,侵权必删!

标签: deepseek

“叫板OpenAI,DeepSeek-V3.1正式发布” 的相关文章

AI版华尔街之狼!o3-mini靠「神之押注」狂赚9倍,DeepSeek R1最

AI版华尔街之狼!o3-mini靠「神之押注」狂赚9倍,DeepSeek R1最

  今天要介绍的Prophet Arena就是一个通过实时更新的真实世界预测任务来评估AI系统预测智能的基准测试。   为「人机协作」而生:你可以给AI提供线索,看看它的...

146 万、丹东市公安局 DeepSeek 70B 部署大单

146 万、丹东市公安局 DeepSeek 70B 部署大单

  根据工作需要及建设符合相关数据安全要求。丹东市公安局拟采购 2 套适合中(小)场景应用的 DeepSeek 70B 运行环境。...

2025世界人工智能大会开幕!喜马拉雅成独家播客合作平台

2025世界人工智能大会开幕!喜马拉雅成独家播客合作平台

  7月26日,2025世界人工智能大会暨人工智能全球治理高级别会议在上海开幕。喜马拉雅作为本次大会独家播客合作平台,在大会现场搭建播客空间,零距离访谈前沿科技领域企业代表,共话AI时代及...

实测低调上线的DeepSeek新模型:编程比Claude 4还能打,写作…还是算

实测低调上线的DeepSeek新模型:编程比Claude 4还能打,写作…还是算

  网友和媒体们隔三岔五就要催更一波,不是「压力给到梁文锋」,就是「全网都在等梁文锋回应」。尽管没有等到 DeepSeek R2,但 DeepSeek 今天还是正式上线并开源了新模型 De...

津门数智跃迁:华为深度携手天津打造中国新质生产力“城市样板”

津门数智跃迁:华为深度携手天津打造中国新质生产力“城市样板”

  2025年上半年,天津所给出的经济“年中成绩单”中,“新质生产力加速形成,即规模以上高技术制造业增加值占比达16.4%,发展含‘新’量、含‘科’量显著增强。”引发业界高度关注。这一亮眼...

“记事本”里的大匠心——记济南烟草“金牌工匠”秦建的18年维保征程

“记事本”里的大匠心——记济南烟草“金牌工匠”秦建的18年维保征程

  从计谋全局擘画区域调和成长新图景;面向当前热门的低空经济使用,二是依托铁塔AIoT能力平台,坚持以革新引领区域一体化高质量成长之路。为通用航空和无人机供给低空平安态势感知办事。海内大进...