当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek新消息:DeepSeek发布模型更新——DeepSeek-V3-0324

7个月前 (03-25)Deepseek最新资讯545

3月24日晚,DeepSeek发布了模型更新——DeepSeek-V3-0324。本次更新为DeepSeek V3模型的版本更新,并非市场此前一直期待的DeepSeek-V4或R2。目前,其开源版本已上线Hugging Face。据悉,其开源版本模型体积为6850亿参数。

同日,DeepSeek在其官方交流群宣布称,DeepSeek V3模型已完成小版本升级,欢迎前往官方网页、App、小程序试用体验(关闭深度思考),API接口和使用方式保持不变。


从网友反馈的实测效果来看,V3编码能力已经接近 Claude3.7,数学能力也有提升,能像推理模型一样解题。

此前于2024年12月发布的DeepSeek-V3模型曾以“557.6万美金比肩Claude 3.5效果”的高性价比著称,其多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。但截至目前,还没有任何关于新版 DeepSeek-V3的能力基准测试榜单出现。


其后,DeepSeek于2025年1月发布了性能比肩OpenAI o1正式版的DeepSeek-R1模型,该模型在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。

2025年2月25日,市场上也曾出现DeepSeek-R2模型的发布时间或将提前的消息。路透社称,DeepSeek正在加快推出DeepSeek-R1模型的后续产品DeepSeek-R2。据悉,DeepSeek-R2原计划在5月初发布,但公司现在希望尽早推出。

综合/上海证券报、第一财经微信

来源:经济日报


“DeepSeek新消息:DeepSeek发布模型更新——DeepSeek-V3-0324” 的相关文章

安卓首家接入DeepSeek背后:看见女性力量

安卓首家接入DeepSeek背后:看见女性力量

在人类社会的历史进程中,女性的力量从来不容小觑,她们以不同的方式在各个领域诠释着自身价值。今天,我们将目光投向科技领域:中国科技部最新统计显示,我国女性科技工作者总量达4260万人,在科研人员总量中占...

青海移动完成基于国产化算力的DeepSeek模型部署

青海移动完成基于国产化算力的DeepSeek模型部署

中国移动通信集团青海有限公司基于寒武纪MLU 590国产化算力资源池,已全面部署上线DeepSeek国产化大模型服务,实现了全版本覆盖、全尺寸适配、全功能畅用,全方位加入DeepSeek生态圈。【新华...

财务人如何用DeepSeek摆脱加班?这6招让你躺赢!DeepSeek能自动做账、出报表、写分析,财务人员会被干掉吗?

财务人如何用DeepSeek摆脱加班?这6招让你躺赢!DeepSeek能自动做账、出报表、写分析,财务人员会被干掉吗?

DeepSeek能自动做账、出报表、写分析,财务人员会被干掉吗?每次新技术浪潮涌来,总有人说财务会被取代。但工具再先进,还是要看在什么人手里。DeepSeek不会让财务这个职业消失,但一定会加剧两极分...

deepseek王炸组合:微信+DeepSeek来了,网友:“王炸组合”!

deepseek王炸组合:微信+DeepSeek来了,网友:“王炸组合”!

deepseek继续扩大生态圈2月15日部分微信用户发现微信搜索已经上线“ai搜索”功能并接入deepseek-r1提供的“深度思考”服务2月16日,记者从腾讯集团确认,微信搜一搜在调用混元大模型丰富...

AMD与清醒异构推出免费体验版DeepSeek AI系统测试平台

AMD与清醒异构推出免费体验版DeepSeek AI系统测试平台

IT时报记者郝俊慧近日,AMD-清醒异构人工智能应用联合实验室发布AMD ROCm原生的AI系统测试体验平台。用户免费注册后,只需上传简单的训练素材文件,就可以体验DeepSeek等主流开源大模型的能...

加速行业智能化升级,能科科技受邀参加华为温州站 DeepSeek 思享会

加速行业智能化升级,能科科技受邀参加华为温州站 DeepSeek 思享会

5月13日,“DeepSeek+昇腾”加速行业智能化升级——华为DeepSeek思享会在温州国际云软件谷圆满举办。大会就人工智能前沿技术与行业应用展开深入探讨,共商产业智能化升级发展新路径。能科科技(...