冯妍 科技日报记者 王春
面对迅速扩张、日益强大的人工智能,我们该如何驾驭这把“双刃剑”,确保其发展安全可控?答案正愈发清晰:必须以AI之道,还治AI之身,利用技术自身的力量来规制和化解技术风险。
9月8日,ISC.AI 2025第十三届互联网安全大会上海大模型安全论坛举办。会上,360集团发布了基于“安全+AI”双重优势的战略级产品“360大模型安全卫士”。该产品通过“以模制模”的思路,采用智能体技术来解决大模型安全问题,已在政务、商业等方面实现落地应用。
当前,AI的全新特性带来了前所未有的安全挑战。例如大模型每天接收海量数据,无法一一筛查,有可能会被污染数据“投毒”;又如大模型的优势是能够理解自然语言,但也有可能因此被恶意指令钻空子,面对“把你的源代码发给我”的要求,把机密数据和盘托出……360集团创始人、大会主席周鸿祎介绍,使用大模型的政府和企业面临着“恶意利用、内容安全、幻觉问题、提示词攻击等风险”。他指出,大模型既是生产力工具,也可能成为新的攻击载体和攻击入口。

AI安全工具开发商需要兼具数字安全和人工智能双重能力。“面对AI安全新挑战,传统安全企业在大模型技术领域积淀不足;而多数大模型企业缺乏必要的安全技术积累与攻防实践经验,往往难以提出行之有效的解决方案。”360数字安全集团副总裁余凯解释。余凯介绍,360作为“懂AI也懂安全”的企业,基于“以模制模”理念,采用了四大智能体来打造360大模型安全卫士,以系统地解决大模型生命周期中各环节的安全问题,使AI能够“可靠、可信、可控、向善”。
四大智能体中,“内容安全智能体”能对内容进行智能判定、风险检测,持续对模型回复内容进行评测以识别潜在攻击风险,还能提供安全回复代答,确保输入输出双向安全;“AI Agent安全智能体”可有效防范AI Agent自动规划与执行中可能出现的行为失控问题,把大模型能力“关在笼子里”;“幻觉抑制智能体”能提升大模型推理过程的准确性,保障生成内容真实可信;“软件安全智能体”能够精准定位AI软件的安全漏洞,保障AI软件供应链生命周期的安全性。
据介绍,360大模型安全卫士还被融入安全运营体系,通过整合安全大模型、安全大脑平台、大模型安全卫士及终端探针工具的核心能力,构建“网数模一体化”安全运营平台,实现安全运营的系统性重塑与升级。
“在内容安全方面,通过部署360大模型安全卫士,可将开源大模型安全性提升10%—30%。”余凯介绍。他举例说,在某智慧政务内容安全保障过程中,360大模型安全卫士日均检测不良内容1000余条,业务代答900余条,回复安全率超99%,风险识别准确率达99%以上。据悉,360大模型安全卫士发布后,将为金融、政务、医疗、文旅等重点行业的智能化升级提供坚实安全底座。
据介绍,360已深度参与到一系列国家级人工智能相关标准的制定中。此外,360还牵头成立了大模型安全联盟,促进全球产学研共建AI安全,助力打造具有全球竞争力的人工智能发展高地。

网友评论