当前位置:首页 > Deepseek最新资讯 > 正文内容

最新的DeepSeek更新了 有网友对新版R1模型进行了测试

2个月前 (05-29)Deepseek最新资讯292

5月28日,DeepSeek在官方交流群中公布,DeepSeek R1模型已完成小版本试升级。用户可在官方网页、APP、小程序测试(打开深度思考),API接口和使用方式保持不变。DeepSeek在开源社区Hugging Face也开源了新版R1模型(R1-0528)。

有网友对新版R1模型进行了测试,并表示Deepseek-R1-0528在竞赛级编程的难度基准LiveCodeBench中的表现几乎与OpenAI的o3模型相当。

社交网络和信息网站City-data.com创始人Lech Mazur在社交媒体上表示,Deepseek-R1-0528在Extended NYT Connections基准测试中比原先的DeepSeek R1有了显著改进,分数从38.6上升到49.8。在Thematic Generation基准测试中,Deepseek-R1-0528也优于DeepSeek R1,分数从1.80变为1.74,该分数越低越好。Thematic Generation基准测试衡量各种大模型如何有效地从一小组正例和反例中推断出一个细分或特定的“主题”(类别/规则),然后在一组具有误导性的候选项中检测出哪一项真正符合该主题。

DeepSeek今年春节期间大火。3月份,DeepSeek V3模型完成小版本升级。新版V3模型借鉴DeepSeek R1模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平,在数学、代码类相关评测集上取得了超过GPT-4.5的得分成绩。在HTML等代码前端任务上,新版V3模型生成的代码可用性更高,视觉效果也更加美观、富有设计感。在中文写作任务方面,新版V3模型基于R1的写作水平进行优化,同时提升中长篇文本创作的内容质量。


“最新的DeepSeek更新了 有网友对新版R1模型进行了测试” 的相关文章

汉王科技:目前公司的电纸本全系产品已经接入Deepseek-R1和V3模型

汉王科技:目前公司的电纸本全系产品已经接入Deepseek-R1和V3模型

每经AI快讯,有投资者在投资者互动平台提问:请问贵司有没有Deepseek概念?汉王科技(002362.SZ)4月10日在投资者互动平台表示,目前公司的电纸本全系产品已经接入Deepseek-R1和V...

北京大学联合华为发布全栈开源DeepSeek推理方案

北京大学联合华为发布全栈开源DeepSeek推理方案

据北京大学网站消息,近日,北京大学联合华为发布DeepSeek全栈开源推理方案。该方案基于北京大学自主研发的SCOW算力平台系统与鹤思调度系统,整合了DeepSeek、openEuler、MindSp...

巨人网络接入DeepSeek技术 推出创新原生游戏玩法

巨人网络接入DeepSeek技术 推出创新原生游戏玩法

新京报贝壳财经讯(记者覃澈)3月14日,巨人网络旗下社交推理游戏《太空杀》宣布基于DeepSeek打造的原生游戏玩法“内鬼挑战”正式开启灰度测试,后续将面向全量用户开放。公开资料显示,这是业内首次将D...

体制内、党政机关写材料,DeepSeek写公文提示词大全

体制内、党政机关写材料,DeepSeek写公文提示词大全

一、通知类文书作为[机构全称]的[职位信息],拟制[特定事项]工作通知。必备模块:[职责划分]、[关键环节]、[执行标准],行文参照《党政机关公文格式》,禁用修饰语,采用"一、二、三&quo...

DeepSeek让观山湖区政务服务实现“边聊边办”

DeepSeek让观山湖区政务服务实现“边聊边办”

近期,贵州省政务服务中心依托国产大模型DeepSeek开发的“贵人智办”AI助手上线,观山湖区作为全省首批试点之一,该功能也在区政务大厅正式亮相。记者走进观山湖区政务大厅看到,B区的自助办理区及“7×...

刘磅带您云参观达实智能大厦:AIoT+DeepSeek如何提升市场部客户接待体验?

刘磅带您云参观达实智能大厦:AIoT+DeepSeek如何提升市场部客户接待体验?

刘磅带您云参观达实智能大厦: AIoT + DeepSeek如何提升市场部客户接待体验?###  借助国产AI大模型发展趋势,达实AIoT智能物联网管控平台升级到了V7版本,展示了生成式AI在园区数字...