当前位置:首页 > Deepseek最新资讯 > 正文内容

清华团队推出“安全增强版DeepSeek”大语言模型RealSafe-R1

2个月前 (02-24)Deepseek最新资讯150

人民网北京2月24日电 (记者赵竹青)2月23日,清华大学计算机系相关研究团队宣布推出大语言模型RealSafe-R1。该模型基于DeepSeek R1进行深度优化与后训练,在确保性能稳定的基础上,显著提升了安全性,为开源大模型的安全发展与风险治理提供了创新性解决方案。

近日来,国产开源大模型DeepSeek在自然语言处理和多任务推理方面展现了强大的技术实力,但在面对越狱攻击等安全性挑战时仍存在一定局限性。为此,清华团队提出了基于模型自我提升的安全对齐方式,将安全对齐与内省推理相结合,使大语言模型能够通过具有安全意识的思维链分析来检查潜在风险,实现基础模型自身能力的自主进化。

基于该方法,团队对DeepSeek-R1系列模型进行后训练,正式推出RealSafe-R1系列大模型。实验数据表明,RealSafe-R1安全性提升显著,在多个基准测试中有效增强了对各种越狱攻击的抵抗力,并减轻了安全与性能之间的“跷跷板”现象。

据悉,RealSafe-R1各尺寸模型及数据集将于近期向全球开发者开源。


“清华团队推出“安全增强版DeepSeek”大语言模型RealSafe-R1” 的相关文章

15+车企怕掉队,紧急宣布接入DeepSeek

15+车企怕掉队,紧急宣布接入DeepSeek

DeepSeek火爆全球,凭借一己之力,戳破英伟达算力“泡沫”,以低成本、开源、免费的形式“哪吒闹海”。这个中国的AI助手,拥有媲美ChatGPT的能力,甚至让美国战略部门高度重视。面对DeepSee...

DeepSeek等大模型促需求增长 上海积极布局算力产业

DeepSeek等大模型促需求增长 上海积极布局算力产业

中新社上海3月28日电 (记者 郑莹莹)“DeepSeek等大模型的爆发应用,促进算力领域的两个拐点提前到来,主要体现在‘增量’和‘提质’两方面。”中国信息通信研究院副院长魏亮28日说。当天,2025...

开启智慧医疗新篇章 四川广元这家医院率先完成DeepSeek本地化部署

开启智慧医疗新篇章 四川广元这家医院率先完成DeepSeek本地化部署

封面新闻记者 刘彦谷3月7日,记者从广元市中心医院了解到,在医疗行业加速数字化转型的关键节点,该院在区域内率先完成基于国产化服务器的DeepSeek智能中枢本地化部署。这一举措通过构建自主可控的AI基...

DeepSeek在政务服务智能审批有哪些优势?

DeepSeek在政务服务智能审批有哪些优势?

DeepSeek在政务服务智能审批中展现出诸多优势,这些优势显著提升了政务服务的效率和质量。以下是DeepSeek在政务服务智能审批中的主要优势:1. 高效响应与处理速度快速响应:DeepS...

神州信息:公司引入国产开源大模型DeepSeek

神州信息:公司引入国产开源大模型DeepSeek

每经AI快讯,有投资者在投资者互动平台提问:公司是否有接入deepseek合作??神州信息(000555.SZ)4月21日在投资者互动平台表示,作为领先的金融科技企业,公司引入国产开源大模型DeepS...

医生自嘲“天塌了”!病人查DeepSeek后质疑治疗方案,关键还说对了!AI看病靠谱吗?

医生自嘲“天塌了”!病人查DeepSeek后质疑治疗方案,关键还说对了!AI看病靠谱吗?

本文转自【新民晚报】;“天都塌了!病人DeepSeek后质疑我的治疗方案,气得我自己又查了一遍指南,才发现指南更新了……”2月22日,广东一位医学博主“孤芳自赏”的网帖引起网友热议。截至23日14时,...