当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek -V3.1让国产算力迎新机遇

2个月前 (08-29)Deepseek最新资讯211

  DeepSeek方面称,本次升级包含以下主要变化:混合推理架构让一个模型同时支持思考模式与非思考模式;相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短时间内给出答案,让模型拥有更高的思考效率;通过Post-Training优化,让新模型有更强的Agent能力,在工具使用与智能体任务中的表现有较大提升。

  据悉,官方App与网页端模型已同步升级为DeepSeek-V3.1。用户可以通过“深度思考”按钮,实现思考模式与非思考模式的自由切换。

  就此,速途研究院院长丁道师告诉《中国经营报》记者,这次版本的升级,性能更强大了,更好用了。但核心还不是这些升值,而是针对国产芯片的优化,这个才是重中之重。

  爱分析首席李喆告诉本报记者,V3.1版本融合了大语言模型和推理模型,做了Agent适配和国产芯片适配。整体来看,模型能力本身没有大提升,主要是工程化方面做了很多优化,更适合在模型之上开发各类应用。

  丁道师认为,英伟达芯片不安全了,我们就要开启国产化了,在这个背景下,DeepSeek进行了这次大升级。“所以说要把这些背景全部结合起来看,才能一目了然看到这一次升级的本质,就是说现在我国大模型人工智能产业要实现自主可控,要不被美国的产品卡脖子,我们就需要在模型、芯片、算法等多个层面实现自主突破,这样就能理解此次DeepSeek的升级,以及华为芯片的升级之所以备受关注的原因所在了,这背后是整个国家战略的支撑。”

  据了解,DeepSeek宣布其新一代模型DeepSeek-V3.1采用了UE8MO FP8 Scale参数精度,该模型与UE8M0FP8动态范围大,提升稳定性与效率,适配华为昇腾等芯片,实现“低卡高能”部署,带动全产业链发展。在政策推动下,其与昇腾组合切入关键领域,打破垄断,对国产算力及AI产业发展意义重大。

  根据中研网预测,2025年中国AI算力市场达1200亿元。华西证券表示,DeepSeek-V3.1通过技术迭代带动芯片、服务器和云服务的联动优化。国产算力链条呈现出“外部受阻、内部加速”的格局,标志着中国大模型生态正在进入自主化与规模化并进的新阶段。

  近日,硅谷顶级风投a16z发布了新一期的AI应用百大榜单。ChatGPT依旧稳坐第一,但这个宝座越来越不稳固了。Google的Gemini用户数已经追到它的一半,它俩现在是两大顶级的新一代人工智能平台。

  马斯克的Grok靠着一款二次元虚拟伴侣Ani,硬是从0发展到2000万月活。DeepSeek在今年年初爆火后,月活跃用户出现下降,移动端下降了22%,网页端达到了40%。不过其他国产应用表现继续亮眼,移动端Top 50的应用中,预计有22款是由中国团队开发的应用。

  在前20名里,阿里的夸克、字节的豆包、月之暗面的Kimi同时上榜。其中,Kimi作为新兴创业团队的一款产品,能和ChatGPT、Gemini这些巨头产品同台竞争,已经说明了国内用户对中文大模型的强烈需求。

  “DeepSeek -V3.1的优势是继续降低了token使用量,降低使用成本。性能与效果层面,V3.1和其他基模无显著差异。后续各家基模能力上不会有特别大差别deepseek,大概率都围绕着如何降低使用成本、提升使用体验和输出稳定性方面进行不断优化。新一轮模型价格战要开始了。”李喆说。

  要论2024年国内最风光的AI明星,DeepSeek认第二,可能没人敢认第一。QuestMobile数据显示,去年一季度它的下载量冲到8111万次,相当于每16个中国人就有1人装了其APP,比当年微信刚出朋友圈还火。

  不过,后来有第三方数据显示,DeepSeek用户使用率和官网流量回落。据第一财经报道,360集团创始人周鸿祎对此表示,DeepSeek官网流量下降是因为DeepSeek没有花心思,但现在很多第三方云服务上都有DeepSeek的服务,用了DeepSeek的大模型流量一直很高。在中国,许多公司包括360智能体的基座模型等都使用DeepSeek来改,相当于很多公司的“武器装备”都是DeepSeek提供的。

  比如,Kimi K2就用了MOE架构,总参数1T,激活参数32B。另外,阿里巴巴通义千问发布新版Qwen3系列模型,包括2个MoE模型和6个dense模型,参数量从0.6B到235B。原文出处:DeepSeek -V3.1让国产算力迎新机遇,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek -V3.1让国产算力迎新机遇” 的相关文章

建华课堂重庆分课堂暨渝北民建大讲堂举办

建华课堂重庆分课堂暨渝北民建大讲堂举办

  7月16日,由民建重庆市委会财政金融委员会、企业委员会,民建渝北区委会联合主办的“建华课堂重庆分课堂暨渝北民建大讲堂”在渝北区举行。市委会专职副主委刘伟出席活动并致辞,民建渝北区委会主...

人工智能+让大模型再洗牌阿里与讯飞双赢DeepSeek留足悬念

人工智能+让大模型再洗牌阿里与讯飞双赢DeepSeek留足悬念

  年的大模型市场,经历了短短八个月的两次洗牌。年初,DeepSeek的开源底座大模型搅动全场,这个量化基金孵化的创业团队自下而上推动全社会范围的AI狂飙,让腾讯、字节这样的流量大厂成为最...

英伟达领投8亿美元,这家AI初创公司要做美国“DeepSeek”

英伟达领投8亿美元,这家AI初创公司要做美国“DeepSeek”

  。除了英伟达之外,本轮融资的投资者还包括光速创投、红杉资本、DST、前谷歌CEO施密特(Eric Schmidt)以及特朗普长子担任合伙人的1789 Capital等deepseek。...

特斯拉接入豆包和DeepSeek

特斯拉接入豆包和DeepSeek

  新京报贝壳财经讯(记者罗亦丹)记者8月22日获悉,特斯拉与火山引擎已于近日达成合作,在国内火山引擎将为特斯拉提供大模型服务,助力特斯拉智能座舱交互体验升级deepseek。...

DeepSeek预测:都灵vs那不勒斯!德布劳内领衔火力全开,那不勒斯客场碾压?

DeepSeek预测:都灵vs那不勒斯!德布劳内领衔火力全开,那不勒斯客场碾压?

  都灵目前排名联赛第16位,仅领先降级区2分,6轮过后1胜2平3负,进5球丢13球,场均进球0.83个(联赛第15),场均丢球高达2.17个(联赛第20)。反观那不勒斯,以5胜1负积15...

DeepSeek与华为模型算力共生推动中国AI系统级突围

DeepSeek与华为模型算力共生推动中国AI系统级突围

  DeepSeek与华为“模型+算力”共生关系,其实给中国产业打开了一扇“系统级突围”的大门——以前我们习惯单点突破(芯片、模型、应用各干各的),现在第一次出现了“硬件-软件-场景”在同...