联通数智推出模型安全五件套

2026-02-28 21:20:20 来源: 科技日报点击数：

科技日报记者崔爽

生成内容是否合规？敏感数据是否泄露？模型接口是否被恶意攻击？数字化浪潮下，AI的应用与发展带来全新安全挑战，这些风险正考验着每一个数字化先行者。

近日，联通数智推出模型安全五件套，以“安全可靠、公平可信、智能向善、效能提升”为目标，提供覆盖数据、模型、内容、接口、防护的安全保障。

其中，数据分类分级智能体内置国家及行业标准知识库，具备“人工智能裁判模型”（7B小模型），支持自适应学习与持续优化，分类分级准确率超95%，提供从资产识别、分类分级到审核复核、备案报送的全流程闭环管理。

大模型安全评估工具通过智能评估引擎，依托千万级合规语料训练的裁判模型，从内容安全、指令安全等维度，为大模型提供贯穿全生命周期的“全面体检”，全面遵循TC260-003《生成式人工智能服务安全基本要求》标准要求，并覆盖31项量化评测体系，实现安全能力的体系化、精准化评估。

大模型安全防火墙提供零改造即插即用的实时安全防护，通过对模型输入输出内容进行实时检测与安全代答，有效拦截有害信息，防御多种越狱攻击，对违规样本召回率达到90%，合规样本误检率小于5%。

数据水印标注智能体为AI生成内容等场景植入文本、图像、音视频的全模态显/隐式数字水印，为防范模型滥用、敏感信息泄露提供全链路溯源证据链，确保内容可识别、可追溯、可监管。

模型接口审计工具结合敏感数据流动监测，通过智能分析引擎建立用户行为基线，对越权访问、异常调用、接口攻击、二次封装等风险进行实时预警与拦截。

责任编辑：陈可轩

网友评论

最热评论

没有更多评论了

1.将浏览器切换回极速模式