当前位置:首页 > Deepseek最新资讯 > 正文内容

华安证券-计算机行业周报:DeepSeek~V3.2~Exp 发布,训练推理提效

1周前 (10-13)Deepseek最新资讯75

  技术层面:1)DeepSeek Spare Attention(DSA)首次实现细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现长文本训练和推理效率的大幅提升。根据各领域性能公开评测集结果(通用、搜索、代码、代码智能体、数学),DeepSeek-V3.2-Exp表现与V3.1-Terminus基本持平;2)开源TileLang与CUDA两种算子,TileLang由北大团队研发,专为简化高难度GPU算子开发而设计,将成为替代主流OpenAI领域特定语言Triton的有力备选,TileLang将调度空间与数据流解耦,使开发者能够直观地控制数据在硬件中的流动,根据TileLang在GitHub的说明文档,不仅支持英伟达CUDA,还已扩展支持华为昇腾等国产芯片。DeepSeek使用高级语言TileLang进行快速原型开发,以支持更深入的探索。在最后阶段deepseek,以TileLang作为精度基线,逐步使用底层语言实现更高效的版本。

  受益于新模型服务成本大幅降低,API调用价格相应下调。目前DeepSeek-V3.2-Exp API价格为输入0.2元/百万tokens(缓存命中),2元/百万tokens(缓存未命中),输出3元/百万tokens。

  新价格政策下开发者调用DeepSeek API的成本将降低50%以上。我们认为,DeepSeek-V3.2-Exp在技术层面探索了新的稀疏注意力机制,推动中国算力生态协同创新与演进,进一步将模型与算法层面的创新,与中间层的编译语言与更底层的计算芯片协同起来,推动中国算力生态的成长。模型发布后华为昇腾和寒武纪均第一时间宣布完成适配工作,表明国产AI算力生态已进入模型与芯片协同设计阶段。相关公司:神州数码、寒武纪、品高股份、北京利尔、安博通、优刻得、浪潮信息、紫光股份、超讯通信、首都在线。

  1)下游预算限制信息化支出;2)财政与货币政策低于预期;3)供应链波动加大,影响科技产业发展。原文出处:华安证券-计算机行业周报:DeepSeek~V3.2~Exp 发布,训练推理提效,API同步降价-251012,感谢原作者,侵权必删!

标签: deepseek

“华安证券-计算机行业周报:DeepSeek~V3.2~Exp 发布,训练推理提效” 的相关文章

HMD 巴萨联名版 3210 功能机上市:支持 Deepseek AI 助手、预

HMD 巴萨联名版 3210 功能机上市:支持 Deepseek AI 助手、预

  IT之家 7 月 29 日消息,HMD 今天上架了巴塞罗那足球队联名版 3210 功能手机,深度定制外壳、壁纸、系统界面等,支持支付宝被扫支付、Deepseek AI 助手,预售到手价...

东鹏控股80后女掌门何颖入选《财富》榜单, 与DeepSeek创始人并肩

东鹏控股80后女掌门何颖入选《财富》榜单, 与DeepSeek创始人并肩

  股份有限公司(下称“东鹏控股”)副董事长兼总裁何颖赫然在列,入选2025年《财富》“中国40岁以下最具潜力的商界精英榜”,且为佛山地区唯一上榜者。   《财富》“中国...

工程界顶级盛会在沪开幕,DeepSeek等入选2025全球十大工程成就

工程界顶级盛会在沪开幕,DeepSeek等入选2025全球十大工程成就

  今天上午,由世界工程组织联合会、中国科协、中国工程院、上海市人民政府共同举办2025世界工程组织联合会全体大会暨全球工程大会,在上海世博中心拉开帷幕。作为全球工程界的顶级盛会,本次大会...

宇树DeepSeek华为比亚迪苹果入选时代年度300大发明

宇树DeepSeek华为比亚迪苹果入选时代年度300大发明

  【#时代杂志公布年度300大发明##DeepSeek宇树入选年度300大发明#】北京时间10月10日,美国《时代》杂志公布了2025年度最佳发明榜单,共有300款产品上榜,其中包括宇树...

英媒:印度为什么诞生不了Nvidia或DeepSeek?

英媒:印度为什么诞生不了Nvidia或DeepSeek?

  今年,DeepSeek 从默默无闻中崭露头角,其大型语言模型被誉为中国的“斯普尼克号时刻”。它彰显了中国在硬件和软件领域的雄心。   然而,在印度,这一突破既令人沮丧...

DeepSeek首度公开R1模型训练成本仅为29.4万美元,“美国同行开始质疑自

DeepSeek首度公开R1模型训练成本仅为29.4万美元,“美国同行开始质疑自

  【文/观察者网 王一】DeepSeek今年年初以高性价比、高性能、开源驱动等特点惊艳了世界。其团队近日在英国《自然》杂志发表论文首次披露,DeepSeek-R1模型的训练成本仅为29....