当前位置:首页 > Deepseek应用场景 > 正文内容

OpenAI罕见宣布将开源推理模型,DeepSeek给逼的

7个月前 (04-01)Deepseek应用场景438

就在刚刚,OpenAI CEO Sam Altman正式宣布,将在未来几个月内推出一款具备推理能力的强大开放权重语言模型,并期待与开发者共同探索如何最大化其潜力。


据Altman透露,这是自GPT-2以来OpenAI首次计划发布开放权重语言模型。


他坦言,虽然这一想法已酝酿许久,但此前其他优先事项占据了主导地位。如今,发布这款模型的时机变得尤为重要。



作为参考,开放权重(open weight)是指将AI模型(尤其是神经网络)的训练参数(即权重)公开,供公众使用、检查或进一步开发。


用户可以在这些权重的基础上进行修改,并将修改后的权重重新分发。


虽然开放权重不能完全等同于开源,是一种介于完全闭源和完全开源之间的折中方案,但它是开源理念在AI领域的一种延伸和部分实现,包括此前宣称开源的DeepSeek V3/R1同样只开放了权重。


在正式发布前,OpenAI将依据其“准备框架”对模型进行评估,确保其安全性与可靠性。


考虑到模型发布后可能被修改,团队还将开展额外测试与优化工作。


为进一步完善开发流程,OpenAI计划举办一系列开发者活动,以收集反馈并展示早期原型。首场活动将于数周后在旧金山启动,随后在欧洲和亚太地区陆续展开。


有兴趣参与的开发者可通过链接报名:
https://openai.com/open-model-feedback



OpenAI研究员约翰内斯·海德克(Johannes Heidecke)对此补充道:


“安全性是我们开发开放权重模型的核心。从预训练到发布,我们都会遵循严格的准备框架,确保不会推出可能引发灾难性风险的模型。尽管开放模型面临独特挑战,我们对此充满信心。”


目前,Altman的评论区已经乱成一锅粥了。


网友呼声最高的模型是OpenAI o1 mini,全球最大AI开源社区Hugging Face CEO Clément Delangue也现身评论区。



谈到开源,自然绕不开DeepSeek。R1和R2的身影也充斥着整个评论区。




网友是懂Sam Altman的。毕竟GPT-5也说是“未来几个月”发布,但至今未见踪影。



Altman此前发文透露,得益于GPT-4o的多模态图像生成功能,OpenAI在过去五天内新增了100万用户。



并且由于大量用户的涌入,导致OpenAI的GPU被“融化了”,等模型开放后只能说形势易转。



值得一提的是,Altman上个月曾与硅谷知名分析师Ben Thompson进行了一场深度对谈,其中也有谈到包括开源模型以及和DeepSeek的竞争。


他当时表示:


我认为DeepSeek确实是个很棒的团队,也做出了很优秀的模型,但他们真正走红的原因,并不完全是模型本身的能力。


这对我们来说是一个教训,那就是当我们隐藏一个功能时(思维链),我们给其他人留下了获得病毒式传播的机会。这是一个很好的警醒。它也让我重新思考我们在免费层中提供的内容,GPT-5将可以免费使用。


在今天的发文中,他表示“我们已经考虑这个问题很长时间了,但其他优先事项曾经占据了更高的优先级,现在感觉发布它变得非常重要。”


显然,这位曾罕见承认OpenAI封闭策略站在“历史的错误一方”的CEO已经深刻认识到开源的战略意义。


在接下来的几个月内,无论是Llama 4,还是DeepSeek R2都将成为击垮OpenAI声誉的重要一击,而此次宣布开源,或许正是OpenAI精心准备的一招反击。


“OpenAI罕见宣布将开源推理模型,DeepSeek给逼的” 的相关文章

中信消金基于自主研发的“信智”一站式大模型服务平台接入DeepSeek大模型

中信消金基于自主研发的“信智”一站式大模型服务平台接入DeepSeek大模型

近日,中信消金基于自主研发的“信智”一站式大模型服务平台接入DeepSeek大模型,并率先应用于智能质检与知识库检索两大业务场景,成为首批接入前沿领先AI大模型的消费金融公司。  在智能质检方面,借助...

DeepSeek引发市场跷跷板!基金经理“忙不停”

DeepSeek引发市场跷跷板!基金经理“忙不停”

“DeepSeek正在引发世界对中国AI产业、中国科技资产,甚至中国整体资产的价值重估。”在接受券商中国记者采访时,一位基金经理满怀激动地讲道。中国AI发展的主流叙事已经逐渐从追赶转向超越,这一认知的...

外媒:从DeepSeek到《哪吒2》 中国不断突破科技创新与艺术创造极限

外媒:从DeepSeek到《哪吒2》 中国不断突破科技创新与艺术创造极限

国际在线专稿:美国《欧亚评论》网站近日刊发学者伊姆兰·哈立德署名文章《从电影票房到人工智能:中国重新定义全球叙事》。文章聚焦近期火爆出圈的两大“中国智造”——国产AI大模型DeepSeek和国产动画影...

科技伦理视域下DeepSeek的学术风险及其防范

科技伦理视域下DeepSeek的学术风险及其防范

作者:刘科(河南师范大学科技与社会研究所教授);贾豫政(河南师范大学科技与社会研究所助理研究员)近期,人们对DeepSeek(深度求索)的热议揭示了人机关系的复杂性,也凸显了在AI领域嵌入科技伦理的必...

deepseek入局搜索混战

deepseek入局搜索混战

DeepSeek应用以史上最快速度达成3000万日活。据调研机构QuestMobile,1月28日,DeepSeek日活跃用户数首次超越豆包,随后在2月1日突破3000万大关。目前DeepSeek、字...

杭州文旅智能体“杭小忆”全面接入DeepSeek!旅游体验开启“超进化”时代

杭州文旅智能体“杭小忆”全面接入DeepSeek!旅游体验开启“超进化”时代

潮新闻客户端 记者 杨希林3月1日,全国首个城市级文旅智能体杭小忆,全面接入DeepSeek-R1。此次升级,杭州城市大脑智能中枢以“隐形桥梁”之姿,实现DeepSeek-R1在政务信创环境的部署应用...