当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek新消息:DeepSeek发布模型更新——DeepSeek-V3-0324

3个月前 (03-25)Deepseek最新资讯253

3月24日晚,DeepSeek发布了模型更新——DeepSeek-V3-0324。本次更新为DeepSeek V3模型的版本更新,并非市场此前一直期待的DeepSeek-V4或R2。目前,其开源版本已上线Hugging Face。据悉,其开源版本模型体积为6850亿参数。

同日,DeepSeek在其官方交流群宣布称,DeepSeek V3模型已完成小版本升级,欢迎前往官方网页、App、小程序试用体验(关闭深度思考),API接口和使用方式保持不变。


从网友反馈的实测效果来看,V3编码能力已经接近 Claude3.7,数学能力也有提升,能像推理模型一样解题。

此前于2024年12月发布的DeepSeek-V3模型曾以“557.6万美金比肩Claude 3.5效果”的高性价比著称,其多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。但截至目前,还没有任何关于新版 DeepSeek-V3的能力基准测试榜单出现。


其后,DeepSeek于2025年1月发布了性能比肩OpenAI o1正式版的DeepSeek-R1模型,该模型在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。

2025年2月25日,市场上也曾出现DeepSeek-R2模型的发布时间或将提前的消息。路透社称,DeepSeek正在加快推出DeepSeek-R1模型的后续产品DeepSeek-R2。据悉,DeepSeek-R2原计划在5月初发布,但公司现在希望尽早推出。

综合/上海证券报、第一财经微信

来源:经济日报


“DeepSeek新消息:DeepSeek发布模型更新——DeepSeek-V3-0324” 的相关文章

DeepSeek进组《流浪地球3》,十年,“赛博工头”和沈腾一起来了

DeepSeek进组《流浪地球3》,十年,“赛博工头”和沈腾一起来了

电影《流浪地球》的官微几天前给广大网友出了道选择题:哪一项危机不是《流浪地球2》中MOSS说的。选项包括:A、2027年时间不足危机;B、2044年太空电梯危机;C、2058年月球坠落危机;D、207...

DeepSeek说:人类可以实现数字永生吗?

DeepSeek说:人类可以实现数字永生吗?

人类是否可以实现数字永生,目前存在技术、伦理与哲学层面的多重挑战,以下是关键要点分析:1. 技术障碍◦ 意识上传的复杂性:意识本质尚未明确,目前技术仅能模拟外在行为(如声音、形象)或部分思维...

DeepSeek说:为什么感觉时间越过越快?

DeepSeek说:为什么感觉时间越过越快?

关于时间感知随年龄增长而加快的现象,科学界提出了多个理论来解释这一普遍体验。以下是主要原因的解析:1. 记忆密度理论(新异刺激理论)◦ 核心机制:大脑通过存储新体验的数量来衡量时间长度。童年...

降准降息时间定了!100万房贷能省多少钱?DeepSeek帮您算算

降准降息时间定了!100万房贷能省多少钱?DeepSeek帮您算算

2025年5月7日,中国人民银行发布关于下调个人住房公积金贷款利率的通知,内容如下:中国人民银行上海总部,各省、自治区、直辖市及计划单列市分行;各政策性银行、国有商业银行,中国邮政储蓄银行,各股份制商...

巨人网络游戏接入DeepSeek

巨人网络游戏接入DeepSeek

3月21日,巨人网络旗下手游《原始征途》在迎来上线两周年之际,正式宣布全面接入国产大模型DeepSeek-R1满血版,其核心AI智能NPC“小师妹”完成技术升级,以“游戏策略专家”与“情感陪伴红颜”双...

鹰潭公司:开展Deepseek应用培训 推动AI技术与业务融合

鹰潭公司:开展Deepseek应用培训 推动AI技术与业务融合

5月21日,鹰潭公司组织召开Deepseek应用培训,鹰潭公司董事长汪斌等参加。培训内容涵盖基础原理、实际应用案例,并特别设置了AI技术实操演练环节,让学员们更加直观地掌握了工具使用技巧。此次培训内容...