当前位置:首页 > Deepseek最新资讯 > 正文内容

清华团队推出“安全增强版DeepSeek”

4个月前 (02-24)Deepseek最新资讯193

人民网北京2月24日电 (记者赵竹青)2月23日,清华大学计算机系相关研究团队宣布推出大语言模型RealSafe-R1。该模型基于DeepSeek R1进行深度优化与后训练,在确保性能稳定的基础上,显著提升了安全性,为开源大模型的安全发展与风险治理提供了创新性解决方案。

近日来,国产开源大模型DeepSeek在自然语言处理和多任务推理方面展现了强大的技术实力,但在面对越狱攻击等安全性挑战时仍存在一定局限性。为此,清华团队提出了基于模型自我提升的安全对齐方式,将安全对齐与内省推理相结合,使大语言模型能够通过具有安全意识的思维链分析来检查潜在风险,实现基础模型自身能力的自主进化。

基于该方法,团队对DeepSeek-R1系列模型进行后训练,正式推出RealSafe-R1系列大模型。实验数据表明,RealSafe-R1安全性提升显著,在多个基准测试中有效增强了对各种越狱攻击的抵抗力,并减轻了安全与性能之间的“跷跷板”现象。

据悉,RealSafe-R1各尺寸模型及数据集将于近期向全球开发者开源。


“清华团队推出“安全增强版DeepSeek”” 的相关文章

约20家车企官宣与DeepSeek深度合作

约20家车企官宣与DeepSeek深度合作

约20家车企官宣与DeepSeek深度合作截至2月14日,已有包括比亚迪、广汽、长安、吉利、奇瑞在内的约20家车企官宣与DeepSeek的深度融合,智能座舱中的人机交互,成为DeepSeek上车后聚焦...

华南理工大学上线满血版DeepSeek!面向省内院校开放

华南理工大学上线满血版DeepSeek!面向省内院校开放

好消息!新学期即将开始华南理工大学本地化部署的满血版DeepSeek-R1正式上线!为进一步培养师生AI思维和使用AI的能力华南理工大学基于学校“成务”科学计算平台成功完成满血版DeepSeek-R1...

中国多地政务服务系统接入DeepSeek效率大增

中国多地政务服务系统接入DeepSeek效率大增

考消息网2月20日报道据台湾“中央社”2月19日报道,深度求索(DeepSeek)推出低成本且高效的大型语言模型掀起热潮,中国多地相继宣布政务服务系统接入应用,称可以大幅提升工作效率。以往要花一天时间...

亚马逊云科技宣布提供完全托管的DeepSeek-R1模型

亚马逊云科技宣布提供完全托管的DeepSeek-R1模型

亚马逊云科技今日宣布,DeepSeek-R1现已作为完全托管的无服务器大语言模型(LLM)在Amazon Bedrock上正式可用, 这也是首个将该模型作为完全托管服务推出的云服务提供商。亚马逊云科技...

深度分析DeepSeek爆火背后,对整个AI产业带来的颠覆与冲击

深度分析DeepSeek爆火背后,对整个AI产业带来的颠覆与冲击

本文参考报告:《2025中国DeepSeek对AI产业的影响》,首发于头豹科创网。DeepSeek在春节期间刷屏朋友圈,引发了AI产业关于低训练成本、开源与闭源模型选择、模型蒸馏及知识产权等话题的热烈...

拥抱人工智能 DeepSeek应用专题培训会成功举办

拥抱人工智能 DeepSeek应用专题培训会成功举办

3月18日下午,由滨海新区区委区级机关工委、区委网信办、区数据局共同主办,区级机关工会联合会承办的DeepSeek应用专题培训会召开。培训聚焦“人工智能领域前沿技术的认知与DeepSeek操作应用能力...