当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek新模型上线,昇腾、寒武纪、海光等宣布适配

3周前 (09-30)Deepseek最新资讯113

  9月29日,DeepSeek-V3.2-Exp模型正式发布并开源。模型引入稀疏Attention架构,据称能够有效降低计算资源消耗并提升模型推理效率。此外,DeepSeek还大幅下调了API价格,降价幅度超过50%。

  据“华为计算”微信公众号29日消息,昇腾已快速基于vLLM/SGLang等推理框架完成适配部署,实现DeepSeek-V3.2-Exp 0day支持,并面向开发者开源所有推理代码和算子实现。

  寒武纪29日表示,已同步实现对深度求索公司最新模型DeepSeek-V3.2-Exp的适配。依托DeepSeek Sparse Attention机制,叠加寒武纪的极致计算效率,可大幅降低长序列场景下的训推成本。

  30日上午,海光信息在官方微信公众号宣布,其DCU实现对DeepSeek-V3.2-Exp的无缝适配+深度调优,DeepSeek-V3.2-Exp在海光DCU上展现出优异的性能,同时验证海光DCU高通用性、高生态兼容度及自主可控的技术优势。

  受此消息提振,9月30日,市场早盘震荡拉升,科创50指数表现强势,其中AI芯片、华为昇腾概念表现活跃。截至下午1点30分,品茗科技涨超19%,铂科新材涨超14%,恒烁股份涨超11%,云天励飞-U、昆仑万维(维权)等跟涨。

  业界分析指出,此次软硬件“双向奔赴”的意义远超单点技术突破deepseek,标志着国产AI生态从“可用”向“好用”演进,通过芯片与模型的联合创新,形成了从底层算力到上层应用的闭环。在全球AI竞争加剧的背景下,自主可控的技术链条不仅降低了对外部供应链的依赖,也为行业提供了更具竞争力的软硬件一体化解决方案。

  国泰海通证券表示,大模型与生成式AI正快速从云端走向消费终端,各巨头加紧构建软硬件一体的AI生态:短期有望提升产品附加值和用户黏性,长期看谁能率先打造出“AI+硬件”的杀手级应用,谁就能在下一波计算平台竞争中占得先机。这也将成为资本市场衡量科技公司成长性的关键指标。原文出处:DeepSeek新模型上线,昇腾、寒武纪、海光等宣布适配,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek新模型上线,昇腾、寒武纪、海光等宣布适配” 的相关文章

豆包月活用户超越DeepSeek

豆包月活用户超越DeepSeek

  同期,腾讯元宝的月活用户规模环比增速最大,高达22.4%,位居原生APP月活用户TOP10第三位,月活规模处于1000万-1亿量级。   月活跃用户规模TOP50AI...

算力大事件!中国算力大会举行,DeepSeek新模型适配下一代国产芯片

算力大事件!中国算力大会举行,DeepSeek新模型适配下一代国产芯片

  我国在用算力中心标准机架达1085万架,智能算力规模达788 EFLOPS,干线400G端口数量大幅增加至14060个,存力总规模超过1680 EB,全国算力中心平均电能利用效率(PU...

奥尔特曼:DeepSeek和Kimi是OpenAI开源的重要原因

奥尔特曼:DeepSeek和Kimi是OpenAI开源的重要原因

  【环球网科技综合报道】8月20日消息,据美国CNBC(美国消费者新闻与商业频道)报道,OpenAI创始人山姆·奥尔特曼日前接受采访时表示,美国低估了中国下一代人工智能的威胁,单靠芯片管...

湛江首发“鲲鹏矩阵”:全国司法行政AI大模型实现“0到1”的突破

湛江首发“鲲鹏矩阵”:全国司法行政AI大模型实现“0到1”的突破

  9 月28日,湛江市司法局举办AI渗透之城司法行政智能应用暨“鲲鹏矩阵”新闻发布会,通过成果展示、案例演示,全面呈现了“鲲鹏矩阵”这一司法行政综合垂直大模型的创新突破与实践成效,为全国...

DeepSeek R2发布延期,技术难题与芯片适配成关键挑战

DeepSeek R2发布延期,技术难题与芯片适配成关键挑战

  近日,关于DeepSeek R2模型迟迟未能发布的问题引发了广泛关注。有消息称,在研发过程中,DeepSeek遭遇了一系列技术挑战,尤其是在使用华为昇腾芯片进行训练时出现了持续性难题,...

基于Deepseek的银行客户经理实战陪练AI解决方案,日均节省客户1.5小时精

基于Deepseek的银行客户经理实战陪练AI解决方案,日均节省客户1.5小时精

  当前银行客户经理面临培训模式与实际需求脱节的挑战:传统 AI 陪练侧重督促客户经理记忆产品知识、金融专业知识等内容,难以应对真实业务中复杂的客户沟通、需求挖掘及个性化营销场景。...