首页>热点 > 要闻 > > 正文

中国科学院信息工程研究所研究员虎嵩林: 促使大模型实现有用性、无害性和诚实性多目标平衡,已成为亟待解决的世界难题

2024-04-27 11:09:46
来源:中国高新技术产业导报 作者:李洋 评论:0
  本报记者 李洋

  “大模型正在成为驱动新质生产力发展的新动能、人类探索未知的新工具,不仅可以对话和生成视频、还可以调用工具、链接物理设备、并通过与机器人结合实现具身智能,大模型本身也正在从人类可利用的工具客体向认识、改造自然社会的主体转变,成为数学定理证明、科学研究的合作者,成为独立运营企业的法律主体。”2024年中关村论坛数据安全治理与发展论坛举办期间,中国科学院信息工程研究所研究员虎嵩林接受记者采访时表示。

  然而,在赋能新时代发展的同时,生成式人工智能也给全球带来了前所未有的安全风险。

  虎嵩林谈到,大模型能力的通用性、潜在的主体地位以及应用的深度与广度,也都将进一步放大其危害程度。包括两位图灵奖得主Hinton、Bengio和谷歌DeepMind和OpenAI的CEO在内的产学两界领军人物联名发出的AI风险声明中,更将AI可能带来的“毁灭性”的风险,上升到了与流行病以及核战争相提并论的高度。2023年底《自然》杂志预测的2024年的重大科学事件中 ,GPT5的发布以及联合国人工智能高级别咨询机构将发布的AI监管相关报告位列其中,反映了全球对协调人工智能发展与安全的重大关切。

  “毫无疑问,促使大模型遵循人类价值观、服从人类意图,规避各类风险,并保障数字和物理空间的应用安全,实现有用性、无害性和诚实性多目标的平衡,已经成为亟待解决的世界难题。”虎嵩林表示。

  虎嵩林进一步解释说,有害信息包括价值偏见,隐私泄露,还有黄赌毒、涉恐涉暴、仇恨、反讽、歧视、刻板印象等等各种信息污染;不实信息包括虚假信息、伪造、欺诈内容等。更广义地讲,也包括由输出信息所直接导致的各类不安全的指令调用、智能体或者具身智能机器人的恶意行为等。而算法模型生成特性及安全漏洞会引发“幻觉”,则是一把“双刃剑”,既有可能是导致有害、不实信息的“元凶”,也有可能是科学创新、艺术创意的能力来源。

  值得注意的是,生成式大模型特有的预训练、微调、上下文、提示、思维链COT等新的学习范式,使其安全具有了与传统AI安全不同的许多新特点,面临诸多新挑战,制约了传统安全方法、经验、工具在大模型安全领域发挥效能。“大模型安全风险的成因既可以是来自各类训练数据的缺陷或算法的局限性等模型内因,也可以是利用这些新型学习范式的恶意使用或蓄意攻击等外因。这使得大模型在数据准备、预训练、微调对齐、推理以及应用阶段都会存在各种潜在的风险。”虎嵩林说,尽管目前我们在安全理论、大模型安全评测、自动化测试、价值观对齐、幻觉缓解等方面都开展了一系列的研究和应用工作,这些领域依然充满了挑战。

  “当下,从理论上,或者说技术上,大模型安全还有很多亟待解决的难题。”虎嵩林坦言,我们对大模型“智能涌现”的原理还所知甚少,对上下文学习、提示学习、思维链等能力的内在机理仍严重缺乏认知。一些研究工作也证明AI的安全性无法完全保障,对任意一个对齐模型总存在一定长度的提示可以将之攻破等,这都极大地制约我们从原理上认识和防御大模型的安全风险。

  “我们需要在现有的技术条件下持续探索,这也是我们设计‘以攻促防、攻防相长’思路,研制Galexy(星河)大模型安全测评平台的原因,也是举办首届生成式人工智能安全大赛的初衷。”虎嵩林表示,我们希望通过“攻、检、防”,不断发现漏洞、自动识别并进行持续化的安全加固,形成一个循环发展的飞轮。据悉,首届生成式人工智能安全大赛设置安全攻击、安全检测、对齐防护三大赛道,旨在吸引广大企业、行业大模型厂商、用户的积极参与,吸引高校和科研院所的高水平研究团队参赛,以聚集国内优势力量,构建攻、检、防三位一体的竞赛与协同发展模式,在对抗循环中不断提升生成式人工智能内生安全能力。

(责任编辑:韩梦晨)

版权与免责声明:
①凡本站注明稿件来源为:中国高新技术产业导报、中国高新网、中高新传媒的所有文字、图片和音视频稿件,版权均属本网所有,任何媒体、网站或个人未经本网协议授权不得转载、链接、转贴或以其他方式复制发表。已经本网授权使用作品的,被授权人应在授权范围内使用,并注明“来源:中国高新网、中高新传媒或者中国高新技术产业导报”。违反上述声明者 ,本网将追究其相关法律责任。
② 任何单位或个人认为本网站或本网站链接内容可能涉嫌侵犯其合法权益,应该及时向本网站书面反馈,并提供身份证明,权属证明及详细侵权情况证明,本网站在收到上述文件后,将会尽快移除被控侵权的内容或链接。
③如因作品内容、版权和其他问题需要与本网联系的,请在该事由发生之日起30日内进行。电话:010-68667266 电子邮件:dbrmt#chih.org (请将“#”换为“@”)
排行
  • 全部/
  • 本月

编辑推荐


扫描添加 中国高新技术产业导报

(数字报)

扫描添加 中国高新APP客户端
扫描添加 导报微信公众号