筑牢智能时代安全底座，360大模型安全卫士在上海发布

2025-09-09 21:19:19 来源: 科技日报点击数：

冯妍科技日报记者王春

面对迅速扩张、日益强大的人工智能，我们该如何驾驭这把“双刃剑”，确保其发展安全可控？答案正愈发清晰：必须以AI之道，还治AI之身，利用技术自身的力量来规制和化解技术风险。

9月8日，ISC.AI 2025第十三届互联网安全大会上海大模型安全论坛举办。会上，360集团发布了基于“安全+AI”双重优势的战略级产品“360大模型安全卫士”。该产品通过“以模制模”的思路，采用智能体技术来解决大模型安全问题，已在政务、商业等方面实现落地应用。

当前，AI的全新特性带来了前所未有的安全挑战。例如大模型每天接收海量数据，无法一一筛查，有可能会被污染数据“投毒”；又如大模型的优势是能够理解自然语言，但也有可能因此被恶意指令钻空子，面对“把你的源代码发给我”的要求，把机密数据和盘托出……360集团创始人、大会主席周鸿祎介绍，使用大模型的政府和企业面临着“恶意利用、内容安全、幻觉问题、提示词攻击等风险”。他指出，大模型既是生产力工具，也可能成为新的攻击载体和攻击入口。

AI安全工具开发商需要兼具数字安全和人工智能双重能力。“面对AI安全新挑战，传统安全企业在大模型技术领域积淀不足；而多数大模型企业缺乏必要的安全技术积累与攻防实践经验，往往难以提出行之有效的解决方案。”360数字安全集团副总裁余凯解释。余凯介绍，360作为“懂AI也懂安全”的企业，基于“以模制模”理念，采用了四大智能体来打造360大模型安全卫士，以系统地解决大模型生命周期中各环节的安全问题，使AI能够“可靠、可信、可控、向善”。

四大智能体中，“内容安全智能体”能对内容进行智能判定、风险检测，持续对模型回复内容进行评测以识别潜在攻击风险，还能提供安全回复代答，确保输入输出双向安全；“AI Agent安全智能体”可有效防范AI Agent自动规划与执行中可能出现的行为失控问题，把大模型能力“关在笼子里”；“幻觉抑制智能体”能提升大模型推理过程的准确性，保障生成内容真实可信；“软件安全智能体”能够精准定位AI软件的安全漏洞，保障AI软件供应链生命周期的安全性。

据介绍，360大模型安全卫士还被融入安全运营体系，通过整合安全大模型、安全大脑平台、大模型安全卫士及终端探针工具的核心能力，构建“网数模一体化”安全运营平台，实现安全运营的系统性重塑与升级。

“在内容安全方面，通过部署360大模型安全卫士，可将开源大模型安全性提升10%—30%。”余凯介绍。他举例说，在某智慧政务内容安全保障过程中，360大模型安全卫士日均检测不良内容1000余条，业务代答900余条，回复安全率超99%，风险识别准确率达99%以上。据悉，360大模型安全卫士发布后，将为金融、政务、医疗、文旅等重点行业的智能化升级提供坚实安全底座。

据介绍，360已深度参与到一系列国家级人工智能相关标准的制定中。此外，360还牵头成立了大模型安全联盟，促进全球产学研共建AI安全，助力打造具有全球竞争力的人工智能发展高地。

责任编辑：王倩

网友评论

最热评论

没有更多评论了

筑牢智能时代安全底座，360大模型安全卫士在上海发布

友情链接

抱歉，您使用的浏览器版本过低或开启了浏览器兼容模式，这会影响您正常浏览本网页

您可以进行以下操作:

1.将浏览器切换回极速模式

2.点击下面图标升级或更换您的浏览器

3.暂不升级，继续浏览