当前位置:首页 > Deepseek应用场景 > 正文内容

德国团队推出DeepSeek-R1T2模型 推理速度提升显著

2个月前 (07-10)Deepseek应用场景243

近日,德国TNG Technology Consulting GmbH团队基于DeepSeek系列模型推出开源混合模型R1T2,其推理速度较DeepSeek R1-0528提升200%,引发AI领域关注。

该模型采用团队提出的“集合专家(AoE)”方法,整合DeepSeek-R1-0528、R1及V3-0324三个父模型的权重张量,在未额外微调的情况下,继承了前者的推理能力、结构化思维及简洁指令特性。据测试,其推理性能达父模型的90%~92%,输出Token量仅为后者的40%,显著降低计算成本。R1T2采用MIT许可协议,已在Hugging Face开放。该模型在数学、编程等结构化任务中表现突出,为企业级应用提供新选择。(潇栋)


“德国团队推出DeepSeek-R1T2模型 推理速度提升显著” 的相关文章

指出错误可领千元奖励?Deepseek用户遇“虚假赔偿承诺”|封面头条

指出错误可领千元奖励?Deepseek用户遇“虚假赔偿承诺”|封面头条

指出错误可领千元奖励?Deepseek用户遇“虚假赔偿承诺”|封面头条封面新闻记者 杨旭斌当你指出AI生成的内容有错误时,得到的不仅是简单的道歉,还有可能收到令你意外的回应:“因为你的指正帮助系统修补...

国泰集团接入DeepSeek大模型

国泰集团接入DeepSeek大模型

国泰集团接入DeepSeek大模型金融研究中心07月01日讯,有投资者向603977/ >国泰集团(603977)提问, 贵司控股子公司江西国泰利民信息科技有限公司的信息化业务是否接入了deep...

万达信息:子公司金唐软件携手DeepSeek打造AI智能体金小唐

万达信息:子公司金唐软件携手DeepSeek打造AI智能体金小唐

金融界7月16日消息,有投资者在互动平台向万达信息提问:卫宁健康发布全新架构ai医疗大模型,请问咱们公司是否有什么AI新架构产品发布或者研发?公司回答表示:感谢您对万达信息的关注。万达信息全资子公司金...

DeepSeek爆火,最应该关注的十大走向

DeepSeek爆火,最应该关注的十大走向

作 者丨孔海丽、赵云帆编 辑丨朱益民DeepSeek火成了现象级,中国公司在全球AI竞技场投下一枚"算法裂变弹"。当硅谷巨头们仍在算力军备竞赛中重兵鏖战,中国工程师用"更...

金美信消费金融引入DeepSeek大模型,开启智能化新篇章

金美信消费金融引入DeepSeek大模型,开启智能化新篇章

近期,金美信消费金融完成DeepSeek大模型的部署上线,标志着公司数字化转型与智能化升级迈向全新阶段。此次技术升级不仅夯实了公司数字化底层能力,更依托生成式AI技术的创新应用,实现办公效率与业务处理...

七年技术攻坚,国产AR手术导航仪迎来“DeepSeek”时刻

七年技术攻坚,国产AR手术导航仪迎来“DeepSeek”时刻

摄影:古道西当海外AR手术导航公司Augmedics迎来全球万例手术的里程碑之际,远在上海张江的刘洋正带领上海霖晏医疗科技有限公司(下称霖晏医疗),发起一场中国高端医疗器械的突围战。2024年4月,这...