第03:新闻·时事
上一期3   4下一期  
返回太仓日报
2025年02月25日 星期二 出版
3 上一篇   下一篇 4  
放大 缩小 默认   
清华团队推出“安全增强版DeepSeek”

  人民网北京2月24日电 2月23日,清华大学计算机系相关研究团队宣布推出大语言模型RealSafe-R1。该模型基于DeepSeek R1进行深度优化与后训练,在确保性能稳定的基础上,显著提升了安全性,为开源大模型的安全发展与风险治理提供了创新性解决方案。

  近日来,国产开源大模型DeepSeek在自然语言处理和多任务推理方面展现了强大的技术实力,但在面对越狱攻击等安全性挑战时仍存在一定局限性。为此,清华团队提出了基于模型自我提升的安全对齐方式,将安全对齐与内省推理相结合,使大语言模型能够通过具有安全意识的思维链分析来检查潜在风险,实现基础模型自身能力的自主进化。

  基于该方法,团队对DeepSeek-R1系列模型进行后训练,正式推出RealSafe-R1系列大模型。实验数据表明,RealSafe-R1安全性提升显著,在多个基准测试中有效增强了对各种越狱攻击的抵抗力,并减轻了安全与性能之间的“跷跷板”现象。

  据悉,RealSafe-R1各尺寸模型及数据集将于近期向全球开发者开源。

3 上一篇   下一篇 4  
放大 缩小 默认   
 
   第01版:一版要闻
   第02版:要闻·综合
   第03版:新闻·时事
   第04版:视觉
推动农业增效益、农村增活力、农民增收入
中国海洋经济总量首次突破10万亿元
主产区进入春灌春播季节
春暖大地劳作忙
买药更安心
“人工智能+”催生行业新变
清华团队推出“安全增强版DeepSeek”
太仓日报新闻·时事03清华团队推出“安全增强版DeepSeek” 2025-02-25 2 2025年02月25日 星期二