当前位置:首页 > Deepseek应用场景 > 正文内容

腾讯再“出牌”!比DeepSeek-R1便宜3/4的深度思考大模型

5个月前 (03-22)Deepseek应用场景333

在此前35天“更新”30次后,3月21日深夜,腾讯混元大模型团队正式推出了自研深度思考模型混元T1正式版。相比以往,这次深夜“上新”也是腾讯摒弃了传统及主流的纯Transformer架构,首次将混合Mamba架构无损应用于超大型推理模型。

深夜“上架”能秒回更便宜

值得关注的是,作为腾讯自研的强推理模型,T1吐字速度达到60~80token/s,在实际生成效果表现中远快于DeepSeek-R1。

目前,用户在使用DeepSeek-R1等推理模型时,由于模型需要进行深度思考,并在提供回答前列出详细的思维链,虽然能够体现较高的智能化水平,但存在响应速度慢、不够高效的短板。

混元T1正式版则吐字快、能秒回,还擅长超长文处理。在体现推理模型基础能力的常见基准测试上,如大语言模型评估增强数据集MMLU-PRO中,混元T1取得87.2分,超越了DeepSeek-R1,仅次于o1。

同在3月21日深夜,混元T1已在腾讯云官网上线。价格方面,输入价格为1元/每百万tokens,输出价格为4元/每百万tokens,输出价格为DeepSeek标准时段的1/4,与DeepSeek优惠时段一致。

年研发投707亿元全速推AI

腾讯发布的最新财报显示,2024年第四季度,腾讯资本开支同比增长386%至365.8亿元,2024年全年资本开支达到767.6亿元,同比增长221%,创历史新高,占总营收的11.6%。研发投入方面,2024年全年的AI研发投入达到706.9亿元,2018年至今累计投入3403亿元。

腾讯董事会主席兼首席执行官马化腾在业绩会上表示,在过去一两个月里,AI得到了很大发展,尤其是在DeepSeek横空出世后,腾讯在云业务、“元宝”(AI应用)上都积极拥抱DeepSeek。

马化腾在业绩会上还表示:“数月前,我们重组了AI团队以聚焦于快速的产品创新及深度的模型研发,增加了AI相关的资本开支,并加大了我们对原生AI产品的研发和营销力度。我们相信这些增加的投资,会通过提升广告业务的效率及游戏的生命周期而带来持续的回报,并随着个人AI应用的加速普及和更多企业采用我们的AI服务,创造更长远的价值。”

腾讯元宝的日活跃用户数在2月至3月增长超20倍。自2月来,腾讯元宝接入DeepSeek满血版和全新混元模型,双核驱动元宝高速进化、日更级迭代,35天版本更新30次;

除此以外,目前腾讯已有元宝、微信、腾讯文档、QQ浏览器、QQ音乐、微信读书等数十款产品及业务接入DeepSeek。

腾讯大模型业务动作频频

从2月13日至3月19日,腾讯元宝35天版本更新共30次,关键更新包括:

2月13日,接入DeepSeek-R1满血版;

2月17日,上线推理模型混元T1;

2月17日,支持读微信文件;

2月18日,紧急支持微信搜索;

2月21日,支持混元和DeepSeek理解图片;

2月23日,支持语音输入;

2月25日,支持一键将对话导出为长图;

2月28日,正式上线电脑版;

3月1日,混元Turbo S灰度上线元宝;

3月4日,支持检索历史对话;

3月6日,支持折起/展开思考过程;

3月7日,支持通过对话链接“接着聊”;

3月8日,朗读支持续播、倍速与暂停;

3月12日,电脑版支持大字体、拖拽上传;

3月12日,支持停止生成回答,可重新编辑再提问;

3月13日,支持上传和导出腾讯文档;

3月17日,支持深色模式;

3月18日,电脑版上线截图提问等多项功能。

文|记者 王丹阳

图|腾讯混元


标签: DeepSeek

“腾讯再“出牌”!比DeepSeek-R1便宜3/4的深度思考大模型” 的相关文章

山东移动DeepSeek政务场景共创沙龙成功举办

山东移动DeepSeek政务场景共创沙龙成功举办

齐鲁网·闪电新闻3月7日讯 3月7日,山东移动与华为联合举办DeepSeek政务场景共创沙龙。本次交流会以“政通智合数聚泉城 共创政务AI新场景”为主题,邀请16地市大数据局相关专家、数百名政务领域资...

DeepSeek 发布 Prover-V2 模型;小米首个推理大模型开源;饿了么宣布超百亿补贴加入外卖战局

DeepSeek 发布 Prover-V2 模型;小米首个推理大模型开源;饿了么宣布超百亿补贴加入外卖战局

DeepSeek 发布 Prover-V2 模型,参数量达 6710 亿4 月 30 日消息,DeepSeek 于 AI 开源社区 Hugging Face 上发布了一个名为 DeepSeek-Pro...

剧本早已写好?Deepseek预测次回合猜中国米晋级方式和绝杀球员

剧本早已写好?Deepseek预测次回合猜中国米晋级方式和绝杀球员

直播吧05月07日讯 今日凌晨,欧冠半决赛次回合的战火熊熊燃起,一场堪称史诗级的巅峰对决激情上演。国际米兰与巴塞罗那狭路相逢,双方鏖战至加时赛,最终国米以4 - 3的比分力克巴萨,昂首挺进决赛。回顾此...

宁夏路网中心举办DeepSeek培训 AI赋能推动智慧交通发展

宁夏路网中心举办DeepSeek培训 AI赋能推动智慧交通发展

宁夏新闻网讯(记者 胡俊)4月24日,宁夏路网监测与应急处置中心举办DeepSeek专题培训班,深化人工智能技术应用能力,推动交通行业智能化转型,以高质量党建聚力实施交通运输提质增效攻坚年。本次培训聚...

DeepSeek有哪些优势和不足之处呢

DeepSeek有哪些优势和不足之处呢

DeepSeek的优势和不足之处具体如下:优势性能卓越:语言理解能力强:在多项权威测试中表现出色,能准确把握复杂语句含义。语言生成能力佳:生成的文本自然流畅、逻辑连贯,且生成速度快,每秒可以生成60个...

OpenAI并未让DeepSeek惊出一身冷汗

OpenAI并未让DeepSeek惊出一身冷汗

出品 | 虎嗅科技组作者 | 房晓楠编辑 | 苗正卿头图 | 视觉中国“OpenAI的创新好像到瓶颈期了。”一位业界人士这样说道。今日凌晨,预热了很久的OpenAI o3模型完整版终于面世,且与以往直...