当前位置:首页 > Deepseek最新资讯 > 正文内容

清华团队推出“安全增强版DeepSeek”

5个月前 (02-24)Deepseek最新资讯276

人民网北京2月24日电 (记者赵竹青)2月23日,清华大学计算机系相关研究团队宣布推出大语言模型RealSafe-R1。该模型基于DeepSeek R1进行深度优化与后训练,在确保性能稳定的基础上,显著提升了安全性,为开源大模型的安全发展与风险治理提供了创新性解决方案。

近日来,国产开源大模型DeepSeek在自然语言处理和多任务推理方面展现了强大的技术实力,但在面对越狱攻击等安全性挑战时仍存在一定局限性。为此,清华团队提出了基于模型自我提升的安全对齐方式,将安全对齐与内省推理相结合,使大语言模型能够通过具有安全意识的思维链分析来检查潜在风险,实现基础模型自身能力的自主进化。

基于该方法,团队对DeepSeek-R1系列模型进行后训练,正式推出RealSafe-R1系列大模型。实验数据表明,RealSafe-R1安全性提升显著,在多个基准测试中有效增强了对各种越狱攻击的抵抗力,并减轻了安全与性能之间的“跷跷板”现象。

据悉,RealSafe-R1各尺寸模型及数据集将于近期向全球开发者开源。


“清华团队推出“安全增强版DeepSeek”” 的相关文章

学位一分钟“秒光”,广州老年大学首个DeepSeek班爆满

学位一分钟“秒光”,广州老年大学首个DeepSeek班爆满

DeepSeek到底有多火?连老人家都超爱!老年大学首个DeepSeek班学位一分钟被抢光!不久前广州市老年干部大学(广州老年大学)开设了全国首个老年大学DeepSeek班“同学”们超级热情学位一分钟...

神思电子:智慧能源产品已接入DeepSeek

神思电子:智慧能源产品已接入DeepSeek

金融界4月7日消息,有投资者在互动平台向神思电子提问:公司部署deepseek了吗?公司回答表示:公司的智慧能源领域相关产品已接入DeepSeek,通过对模型的持续训练,助力能源行业管理、运营流程及服...

中国军工迎来DeepSeek时刻?重视内外需双循环景气周期

中国军工迎来DeepSeek时刻?重视内外需双循环景气周期

近期,军工板块成为了市场资金聚焦与追捧的热点。随着年报和一季报的陆续披露,军工板块业绩底部特征愈发明显。展望后续,随着订单逐步落地并完成交付,其业绩有望实现逐季回升。在内需稳步增长以及军贸需求不断释放...

平板本地部署DeepSeek,全球首款!天禧个人超级智能体重大升级

平板本地部署DeepSeek,全球首款!天禧个人超级智能体重大升级

联想天禧个人超级智能体重磅升级,多款AI新品惊艳亮相 近日,联想在科技领域再度发力,正式宣布天禧个人超级智能体迎来又一次重大升级,向全面L3智能阶段大步迈进。与此同时,联想还发布了全行业首款专注于为...

DeepSeek又得了个第一

DeepSeek又得了个第一

智东西2月14日报道,刚刚,DeepSeek在开源社区Hugging Face上的点赞数跃居第一,获约8730次点赞,这一数字仍在持续上涨。这是继DeepSeek应用力压ChatGPT登顶美区App...

DeepSeek+昇腾云技术创享会重庆站成功举办

DeepSeek+昇腾云技术创享会重庆站成功举办

2月27日,以“山城论道 智链未来”为主题的“探秘DeepSeek行业影响暨华为云昇腾云技术创享会”在重庆成功举办。活动现场,政府代表、行业专家、企业决策者及技术开发者等300余人齐聚一堂,围绕人工智...