当前位置:首页 > Deepseek最新资讯 > 正文内容

最新的DeepSeek更新了 有网友对新版R1模型进行了测试

5个月前 (05-29)Deepseek最新资讯532

5月28日,DeepSeek在官方交流群中公布,DeepSeek R1模型已完成小版本试升级。用户可在官方网页、APP、小程序测试(打开深度思考),API接口和使用方式保持不变。DeepSeek在开源社区Hugging Face也开源了新版R1模型(R1-0528)。

有网友对新版R1模型进行了测试,并表示Deepseek-R1-0528在竞赛级编程的难度基准LiveCodeBench中的表现几乎与OpenAI的o3模型相当。

社交网络和信息网站City-data.com创始人Lech Mazur在社交媒体上表示,Deepseek-R1-0528在Extended NYT Connections基准测试中比原先的DeepSeek R1有了显著改进,分数从38.6上升到49.8。在Thematic Generation基准测试中,Deepseek-R1-0528也优于DeepSeek R1,分数从1.80变为1.74,该分数越低越好。Thematic Generation基准测试衡量各种大模型如何有效地从一小组正例和反例中推断出一个细分或特定的“主题”(类别/规则),然后在一组具有误导性的候选项中检测出哪一项真正符合该主题。

DeepSeek今年春节期间大火。3月份,DeepSeek V3模型完成小版本升级。新版V3模型借鉴DeepSeek R1模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平,在数学、代码类相关评测集上取得了超过GPT-4.5的得分成绩。在HTML等代码前端任务上,新版V3模型生成的代码可用性更高,视觉效果也更加美观、富有设计感。在中文写作任务方面,新版V3模型基于R1的写作水平进行优化,同时提升中长篇文本创作的内容质量。


“最新的DeepSeek更新了 有网友对新版R1模型进行了测试” 的相关文章

可灵AI全面接入DeepSeek,降低AI创意内容门槛

可灵AI全面接入DeepSeek,降低AI创意内容门槛

36氪获悉,近日,快手可灵AI已全面接入DeepSeek-R1,在视频生成、图片生成等场景下,用户可通过DeepSeek协助生成或者优化提示词,轻松将灵感转化为专业提示词,打造高质量创意视频。在文生视...

除了三大件还要卷AI,合资油车欲靠DeepSeek翻身-没有DeepSeek都不好意思卖车

除了三大件还要卷AI,合资油车欲靠DeepSeek翻身-没有DeepSeek都不好意思卖车

没有DeepSeek都不好意思卖车。DeepSeek,颇有要成为油车救世主的感觉。从今年1月问世伊始,多家车企宣布旗下车型接入DeepSeek,围绕DeepSeek的“军备竞赛”随即拉开帷幕,在近期上...

DeepSeek说:你最看重人类的五个品质是什么?

DeepSeek说:你最看重人类的五个品质是什么?

1. 共情能力(Empathy)(1)核心价值:能够感知他人情绪、理解不同立场的核心能力,是建立信任、化解冲突的基础。(2)现实意义:◦在人际关系中避免“自我中心”陷阱(如职场沟通、家庭矛盾)。◦推动...

一夜爆火的DeepSeek一体机,如何改写AI游戏规则?

一夜爆火的DeepSeek一体机,如何改写AI游戏规则?

过去一个多月,科技圈有个“新晋顶流”C位出道,名字叫DeepSeek一体机。它火到什么程度?朋友圈不断刷屏,有人调侃:“没抢到DeepSeek一体机,都不好意思说自己懂AI。”所谓一体机,通常汇集了中...

快手旗下快影接入DeepSeek-R1满血版

快手旗下快影接入DeepSeek-R1满血版

快手旗下剪辑软件快影正式接入DeepSeek-R1满血版,成为行业首批接入DeepSeek能力的剪辑工具。快影将融合DeepSeek-R1模型技术,并加持可灵AI视频生成能力,集成文案成片、小说漫、A...

海尔消费金融部署DeepSeek,客服质检效率显著提升

海尔消费金融部署DeepSeek,客服质检效率显著提升

随着人工智能技术的飞速发展,金融行业的数字化转型步伐也在不断加快。海尔消费金融作为行业内的佼佼者,率先引入了前沿的AI模型DeepSeek,以提升客服质检效率,进一步优化客户体验。DeepSeek作为...