当前位置:首页 > Deepseek最新资讯 > 正文内容

清华团队推出“安全增强版DeepSeek”

8个月前 (02-24)Deepseek最新资讯390

人民网北京2月24日电 (记者赵竹青)2月23日,清华大学计算机系相关研究团队宣布推出大语言模型RealSafe-R1。该模型基于DeepSeek R1进行深度优化与后训练,在确保性能稳定的基础上,显著提升了安全性,为开源大模型的安全发展与风险治理提供了创新性解决方案。

近日来,国产开源大模型DeepSeek在自然语言处理和多任务推理方面展现了强大的技术实力,但在面对越狱攻击等安全性挑战时仍存在一定局限性。为此,清华团队提出了基于模型自我提升的安全对齐方式,将安全对齐与内省推理相结合,使大语言模型能够通过具有安全意识的思维链分析来检查潜在风险,实现基础模型自身能力的自主进化。

基于该方法,团队对DeepSeek-R1系列模型进行后训练,正式推出RealSafe-R1系列大模型。实验数据表明,RealSafe-R1安全性提升显著,在多个基准测试中有效增强了对各种越狱攻击的抵抗力,并减轻了安全与性能之间的“跷跷板”现象。

据悉,RealSafe-R1各尺寸模型及数据集将于近期向全球开发者开源。


“清华团队推出“安全增强版DeepSeek”” 的相关文章

图灵奖得主LeCun:DeepSeek开源在产品层是一种竞争,但在基础方法层更像是一种合作;新一代AI将情感化(复制)

图灵奖得主LeCun:DeepSeek开源在产品层是一种竞争,但在基础方法层更像是一种合作;新一代AI将情感化(复制)

图灵奖得主LeCun:DeepSeek开源在产品层是一种竞争,但在基础方法层更像是一种合作;新一代AI将情感化(复制)作者| This is World来源 | Z Po...

50个DeepSeek高阶提示词,一键职场开挂!(附下载)

50个DeepSeek高阶提示词,一键职场开挂!(附下载)

“ 知识就是力量,科技就是生产力!”在快节奏的现代生活中,我们总是在寻找那些能够让我们事半功倍的秘密武器。今天,我要向大家强烈推荐一份宝藏资料——《DeepSeek50个高阶提示词.pdf》...

DeepSeek严选“春茶饮用指南”,是谁的DNA动了

DeepSeek严选“春茶饮用指南”,是谁的DNA动了

“明前茶,贵如金”眼下,正是品尝明前茶的好时候清明前茶树的芽叶最嫩且产量有限我们请DeepSeek当推荐官生成了一份“春茶饮用指南”来看看它的严选↓↓西湖龙井·浙江“明前茶标杆”龙井,当前最为应季。清...

中文网址注册接入DeepSeek,发挥AI优势精准封堵企业知识产权保护漏洞

中文网址注册接入DeepSeek,发挥AI优势精准封堵企业知识产权保护漏洞

中文网址注册服务支持DeepSeek-R1满血版推荐功能,是AI大模型技术落地应用的又一创新典范。该技术大幅提升了中文网址注册的精准度和全面性,可以针对数字时代知识产权保护的痛点、难点为企业提供更为专...

共探 AI 赋能新质生产力,华为云广东DeepSeek思享会海珠站成功举办

共探 AI 赋能新质生产力,华为云广东DeepSeek思享会海珠站成功举办

作为粤港澳大湾区人工智能创新策源地,琶洲已集聚超7000 家泛人工智能企业,形成技术研发、场景应用、生态服务完整产业链。4 月 17 日,由琶洲管委会与华为云联合主办的“广东DeepSeek思享会・海...

deepseek什么意思主要用来做什么 深入了解DeepSeek:探索未来科技的无限潜力

deepseek什么意思主要用来做什么 深入了解DeepSeek:探索未来科技的无限潜力

标题:深入了解DeepSeek:探索未来科技的无限潜力关键词:DeepSeek,人工智能,智能搜索,数据分析,技术革新,应用场景描述:深入解析DeepSeek的含义与应用,了解它如何革新行业和改善日常...