当前位置:首页 > DeepSeek技术交流 > 正文内容

OpenAI开源模型发布推迟至夏末,为了狙击DeepSeek R2?

5个月前 (06-11)DeepSeek技术交流394

当开源AI模型正成为技术巨头必争之地,OpenAI却出人意料地按下暂停键。OpenAI首席执行官Sam Altman宣布其备受期待的开源模型将延期至“今年夏天晚些时候”,而非原定的6月。这场技术突袭恰逢中国DeepSeek等开源强敌加速抢滩,延期背后是技术豪赌还是市场狙击?

6月11日周三,Altman在X平台发文称:

我们将对开源权重模型投入更多时间,也就是说,预计会在今年夏天晚些时候推出,而不是六月。我们的研究团队做了一些出乎意料且相当令人惊叹的事情,我们认为这将非常非常值得等待,但需要稍长时间。

据此前规划,该模型将具备与GPT-4o相当的复杂推理能力,性能目标直指超越当前顶尖开源推理模型——包括中国深度求索(DeepSeek)的R1模型。

当前AI市场竞争已经显著加剧。周二,法国AI实验室Mistral推出了其首个AI推理模型系列Magistral;4月,中国AI实验室通义千问(Qwen)发布了一系列混合AI推理模型,能够在深入推理和传统快速响应间切换。

据TechCrunch此前报道,OpenAI领导层曾讨论为开源AI模型增加复杂功能,包括开源模型添加连接云端大模型的接口功能,以处理超复杂查询。然而,这些功能是否会被纳入最终版本尚不清楚。

更深层压力来自企业战略转型。Altman曾公开承认,OpenAI过去在开源方面一直站在“历史错误的一边”。此次开源模型被视为修复开发者关系的核心举措,若无法在性能上匹敌DeepSeek R1等头部开源产品,OpenAI将面临巨大声誉风险。

网友也猜测,OpenAI此举可能是为了狙击DeepSeek R2。“如果现在匆忙发一个,等DeepSeek R2出来,打不过就很尴尬了。”

DeepSeek R2指日可待

DeepSeek R2是深度求索公司研发的新一代多模态大语言模型,作为其前代产品R1的迭代版本,R2在技术架构、功能特性、资源效率等方面实现了显著升级。

摩根士丹利6月初一篇研报预测,DeepSeek R2的AI调用成本大降87%,推理能力升级,图像、语音、视频全能处理。

华尔街见闻此前文章提及,DeepSeek创始人梁文锋曾表示:“中国也要逐步成为创新贡献者,而不是一直搭便车。” 他将探索通用人工智能的本质作为核心使命。

根据《中国企业家》的报道,DeepSeek创始人梁文锋带领的AI团队一直保持着与国际巨头同步的产品迭代节奏——2024年9月推出V2.5版本,12月发布V3基础架构,次年3月升级至V3-0324版本,形成每季度重大更新的开发范式。

如此稳健而高效的产品迭代节奏,传言已久的DeepSeek R2或指日可待。


“OpenAI开源模型发布推迟至夏末,为了狙击DeepSeek R2?” 的相关文章

DeepSeek 缺席 WAIC 却成焦点?梁文锋的深度求索该何去何从

DeepSeek 缺席 WAIC 却成焦点?梁文锋的深度求索该何去何从

来源:大模型之家今年的世界人工智能大会(WAIC)现场有个挺有意思的现象:DeepSeek明明从未到场,却成了绕不开的“隐形主角”。这种“存在感”首先体现在技术对标上——阶跃星辰在大会前一天发布的 S...

英伟达CEO黄仁勋:中国的Deepseek和阿里通义是当前最佳开源模型

英伟达CEO黄仁勋:中国的Deepseek和阿里通义是当前最佳开源模型

IT之家 5 月 30 日消息,据日经亚洲报道,北京时间 29 日凌晨,英伟达 CEO 黄仁勋表示,“中国发展 AI 的进程不会因有没有美国芯片而中断…… 关键问题不在于中国有没有 AI—— 它已经有...

金美信消费金融引入DeepSeek大模型,开启智能化新篇章

金美信消费金融引入DeepSeek大模型,开启智能化新篇章

近期,金美信消费金融完成DeepSeek大模型的部署上线,标志着公司数字化转型与智能化升级迈向全新阶段。此次技术升级不仅夯实了公司数字化底层能力,更依托生成式AI技术的创新应用,实现办公效率与业务处理...

金美信消费金融引入DeepSeek大模型,开启智能化新篇章

金美信消费金融引入DeepSeek大模型,开启智能化新篇章

来源标题:金美信消费金融引入DeepSeek大模型,开启智能化新篇章近期,金美信消费金融完成DeepSeek大模型的部署上线,标志着公司数字化转型与智能化升级迈向全新阶段。此次技术升级不仅夯实了公司数...

DeepSeek服务器崩了!百万用户集体“断网”,学生党崩溃

DeepSeek服务器崩了!百万用户集体“断网”,学生党崩溃

7月3日早间,国内知名AI工具DeepSeek突发大面积宕机,大量用户在社交媒体反映无法正常使用。据用户反馈,问题主要集中在无法提交提问、回复严重延迟、频繁显示"服务器繁忙"等。部...

七年技术攻坚,国产AR手术导航仪迎来“DeepSeek”时刻

七年技术攻坚,国产AR手术导航仪迎来“DeepSeek”时刻

当海外AR手术导航公司Augmedics迎来全球万例手术的里程碑之际,远在上海张江的刘洋正带领上海霖晏医疗科技有限公司(下称霖晏医疗),发起一场中国高端医疗器械的突围战。2024年4月,这家初创企业自...