当前位置:首页 > Deepseek最新资讯 > 正文内容

清华团队推出“安全增强版DeepSeek”大语言模型RealSafe-R1

4个月前 (02-24)Deepseek最新资讯211

人民网北京2月24日电 (记者赵竹青)2月23日,清华大学计算机系相关研究团队宣布推出大语言模型RealSafe-R1。该模型基于DeepSeek R1进行深度优化与后训练,在确保性能稳定的基础上,显著提升了安全性,为开源大模型的安全发展与风险治理提供了创新性解决方案。

近日来,国产开源大模型DeepSeek在自然语言处理和多任务推理方面展现了强大的技术实力,但在面对越狱攻击等安全性挑战时仍存在一定局限性。为此,清华团队提出了基于模型自我提升的安全对齐方式,将安全对齐与内省推理相结合,使大语言模型能够通过具有安全意识的思维链分析来检查潜在风险,实现基础模型自身能力的自主进化。

基于该方法,团队对DeepSeek-R1系列模型进行后训练,正式推出RealSafe-R1系列大模型。实验数据表明,RealSafe-R1安全性提升显著,在多个基准测试中有效增强了对各种越狱攻击的抵抗力,并减轻了安全与性能之间的“跷跷板”现象。

据悉,RealSafe-R1各尺寸模型及数据集将于近期向全球开发者开源。


“清华团队推出“安全增强版DeepSeek”大语言模型RealSafe-R1” 的相关文章

DeepSeek加速推开ASIC时代大门

DeepSeek加速推开ASIC时代大门

近日,DeepSeek研究团队再放大招,公开NSA算法。同日,马斯克发布Grok 3模型,试与DeepSeek和Open AI来比高。此外,Open AI首款AI ASIC芯片即将完成,有望明年量产....

DeepSeek智能体正在改变工作方式?学会这3招,提升你的职业竞争力

DeepSeek智能体正在改变工作方式?学会这3招,提升你的职业竞争力

你还在手动整理数据?还在为写不出高质量文案而苦恼?小心被AI淘汰!2024年,职场内卷已经到了白热化阶段。但比内卷更可怕的是什么?是降维打击!当别人用DeepSeek智能体几分钟搞定你一天的工作,你的...

DeepSeek、美图奇想大模型入选中国生成式AI服务榜单

DeepSeek、美图奇想大模型入选中国生成式AI服务榜单

5月15日,德本咨询(DBC)发布2025中国生成式人工智能服务TOP100榜单,DeepSeek(深度求索)、豆包(字节跳动)、通义千问(阿里)、奇想大模型(美图公司)等入选。2025年,生成式AI...

刘慈欣称 DeepSeek 暂时不太会替代科幻作家

刘慈欣称 DeepSeek 暂时不太会替代科幻作家

IT之家 3 月 30 日消息,DeepSeek 未来有可能替代科幻作家吗?据央视财经昨日报道,科幻作家刘慈欣表示,暂时不太会,但是再过 10 年、20 年,从理论上说完全可能代替科幻小说作家。刘慈欣...

企业微信接入 DeepSeek 模型,支持智能机器人、智能表格

企业微信接入 DeepSeek 模型,支持智能机器人、智能表格

IT之家 2 月 21 日消息,企业微信今日宣布接入 DeepSeek 模型,带来了「智能机器人」、「智能表格-客户跟进总结」等 AI 功能。IT之家从官方介绍获悉,接入 DeepSeek、混元等大模...

《高效玩转DeepSeek》刘典著-助力读者在办公、写作、编程、数据分析等领域实现智能化提升

《高效玩转DeepSeek》刘典著-助力读者在办公、写作、编程、数据分析等领域实现智能化提升

  刘典 著  北京联合出版公司  内容简介:本书是深入介绍AI运用的学习指南,旨在帮助读者快速掌握DeepSeek的强大功能,提升工作和学习效率,拓展AI应用能力。全书分为“认知篇”“基础...