科技日报记者 崔爽
生成内容是否合规?敏感数据是否泄露?模型接口是否被恶意攻击?数字化浪潮下,AI的应用与发展带来全新安全挑战,这些风险正考验着每一个数字化先行者。
近日,联通数智推出模型安全五件套,以“安全可靠、公平可信、智能向善、效能提升”为目标,提供覆盖数据、模型、内容、接口、防护的安全保障。
其中,数据分类分级智能体内置国家及行业标准知识库,具备“人工智能裁判模型”(7B小模型),支持自适应学习与持续优化,分类分级准确率超95%,提供从资产识别、分类分级到审核复核、备案报送的全流程闭环管理。
大模型安全评估工具通过智能评估引擎,依托千万级合规语料训练的裁判模型,从内容安全、指令安全等维度,为大模型提供贯穿全生命周期的“全面体检”,全面遵循TC260-003《生成式人工智能服务安全基本要求》标准要求,并覆盖31项量化评测体系,实现安全能力的体系化、精准化评估。
大模型安全防火墙提供零改造即插即用的实时安全防护,通过对模型输入输出内容进行实时检测与安全代答,有效拦截有害信息,防御多种越狱攻击,对违规样本召回率达到90%,合规样本误检率小于5%。
数据水印标注智能体为AI生成内容等场景植入文本、图像、音视频的全模态显/隐式数字水印,为防范模型滥用、敏感信息泄露提供全链路溯源证据链,确保内容可识别、可追溯、可监管。
模型接口审计工具结合敏感数据流动监测,通过智能分析引擎建立用户行为基线,对越权访问、异常调用、接口攻击、二次封装等风险进行实时预警与拦截。

网友评论