当前位置:首页 > DeepSeek技术交流 > 正文内容

DeepSeek V3升级版发布:编程数学能力接近Claude 3.7

7个月前 (03-25)DeepSeek技术交流494

DeepSeek于24日夜间发布V3模型小版本升级,新版本DeepSeek-V3-0324在模型参数上达到685B,并采用MIT许可证,为用户带来全新体验。该版本重点提升了数学和编程能力,性能接近Claude 3.7 Sonnet,且对用户免费开放使用。

模型架构全面升级

DeepSeek-V3作为专家混合巨头模型,原始参数为671B,每个Token可激活370亿个参数。新版本DeepSeek-V3-0324的模型参数提升至685B,采用多头潜在注意力和DeepSeek MoE技术支持。知识截止日期从2023年12月延长至2024年7月,优化了Function call功能,解决了此前版本的函数调用问题。

编程能力显著提升

在前端编程领域,DeepSeek V3-0324展现出惊人实力。测试显示,其能在3分钟内完成750行电商网站代码,包含动态产品卡片悬停效果和手机端响应式布局等功能。自2024年6月以来,业界普遍认为仅Claude 3.5能够生成优质前端代码,而此次DeepSeek的升级版本终于为Anthropic带来了强劲竞争对手。在数学能力方面,V3-0324也表现出色,成功解答了此前大模型普遍解答错误的数学题目。

开源协议引领行业变革

DeepSeek V3-0324采用MIT许可证,允许用户出于任何目的使用、修改和分发模型,包括商业用途。这一决策获得业内广泛关注,Perplexity CEO阿拉文德认为,DeepSeek的开源策略具有革命性意义。该模型不仅能在AWS和Azure上以极低成本部署,仅需支付服务器费用,还为创业企业提供了可负担的AI解决方案。这种开源模式可能影响未来AI巨头的融资格局,推动行业向更开放、更透明的方向发展。

本文源自:金融界


“DeepSeek V3升级版发布:编程数学能力接近Claude 3.7” 的相关文章

美财长称最近美股崩盘原因是DeepSeek而非特朗普的政策

美财长称最近美股崩盘原因是DeepSeek而非特朗普的政策

据环球时报援引路透社报道,在4月5日公开的一次采访中,美国财政部长贝森特将美股崩盘归咎于DeepSeek,而非特朗普的经济政策。...

DeepSeek“乱编”坑惨大学生?这个话题冲上热搜!有救了……

DeepSeek“乱编”坑惨大学生?这个话题冲上热搜!有救了……

在人工智能飞速发展的当下对于广大学生和科研工作者而言一个关键问题随之而来借助这些前沿大模型写论文真的靠谱吗?不久前#防止DeepSeek乱编文献的方法#冲上热搜记者注意到用AI工具写论文“被坑”的经历...

弘信电子:全资子公司安联通已经推出安联云业务,安联云可一键部署DeepSeek系列镜像

弘信电子:全资子公司安联通已经推出安联云业务,安联云可一键部署DeepSeek系列镜像

每经AI快讯,有投资者在投资者互动平台提问:子公司安联通是否有云计算业务?弘信电子(300657.SZ)3月31日在投资者互动平台表示,公司全资子公司安联通已经推出安联云业务,安联云平台配备GPU的云...

DeepSeek价格下调,API调用错峰时段降幅最高达75%

DeepSeek价格下调,API调用错峰时段降幅最高达75%

经快讯,2月26日,DeepSeek API开放平台宣布,即日起,北京时间每日00:30至08:30的夜间空闲时段,DeepSeek开放平台推出错峰优惠活动。在此期间,API调用价格大幅下调:Deep...

DeepSeek说:人类可以实现数字永生吗?

DeepSeek说:人类可以实现数字永生吗?

人类是否可以实现数字永生,目前存在技术、伦理与哲学层面的多重挑战,以下是关键要点分析:1. 技术障碍◦ 意识上传的复杂性:意识本质尚未明确,目前技术仅能模拟外在行为(如声音、形象)或部分思维...

15+车企怕掉队,紧急宣布接入DeepSeek

15+车企怕掉队,紧急宣布接入DeepSeek

DeepSeek火爆全球,凭借一己之力,戳破英伟达算力“泡沫”,以低成本、开源、免费的形式“哪吒闹海”。这个中国的AI助手,拥有媲美ChatGPT的能力,甚至让美国战略部门高度重视。面对DeepSee...