预判故障、精准定位!复杂系统可靠性新标准来了

2025-10-18 23:01:41 来源: 科技日报 点击数:

科技日报记者 代小佩

手机为什么出现死机、黑屏、卡顿等问题?新能源汽车车机系统突然“罢工”是什么原因?

这些日常生活中可能出现的情形,涉及一项专业技术——复杂系统可靠性技术。手机和车机系统可以看作复杂系统,如果没有可靠性技术做后盾,相关设备及其通信系统就无法正常稳定运行。

10月17日—18日,中国科协“开放合作月”期间,2025年复杂系统可靠性科学与工程国际会议在北京召开。与会国内外嘉宾围绕复杂系统可靠性的前沿技术展开交流讨论。

会上发布了《复杂系统可靠性与安全性系列标准》部分内容。该标准属于中国指挥与控制学会的团体标准。分为复杂软件系统通用质量特性、复杂智能系统通用质量特性、装备可靠性等五大子系列共40余项具体标准。

为民可靠性系统工程研究院技术院长伍湘平介绍,此次发布新标准有两大亮点:一是人工智能在可靠性领域的应用,二是北京航空航天大学提出的确信可靠性理论。“这两个方向无论从理论层面还是工程应用层面,都具有很高的应用价值。”伍湘平说。

从实践来看,AI在网络运维领域主要解决两个核心问题:故障预测与故障诊断。

在故障预测方面,产品或网络出现故障前往往会出现征兆,如同人生病前存在健康隐患。通过大数据分析,AI能提前预判故障的发生,进而及时采取措施规避故障。“这与AI在医疗领域的应用原理相近,即通过分析亚健康状态等征兆,提前预警疾病风险并干预。”伍湘平介绍。

在故障诊断方面,核心是定位故障点。在复杂系统中,如通信网络,准确定位具体故障节点或链路难度极大。历史上部分网络瘫痪事故持续数小时甚至数天未能解决,根源就在于故障定位困难。传统的故障树、告警关联等方法效果不佳,而AI通过分析网络运行产生的海量运营、故障案例数据,挖掘症状与失效之间的关联,有效提升了故障定位的准确性。

确信可靠性理论又有何价值呢?

复杂系统通常具有高价值特性,如何评估其可靠性一直是传统可靠性领域的难题,而且缺乏优质解决方案。“北京航空航天大学团队提出的确信可靠性理论,从基于统计学的传统方法,发展为基于失效机理分析的理论,有效解决了这一问题,且已取得诸多成功应用。”北京航空航天大学副教授廖伟骏说。

伍湘平表示,技术标准是一个动态过程。传统标准已然存在,但需要不断提出新技术标准以解决传统方法难以处理的问题。

“此次发布的新标准对面临复杂系统可靠性问题的群体意义重大,尤其适用于军工产品。军工产品多属于复杂、高价值、小样本的产品,在其可靠性评估以及故障处理等领域,该标准中的相关内容均具有很高的参考和应用价值。”伍湘平强调。

伍湘平补充道,虽然不同国家、行业、企业的产品、发展阶段和面临的问题各不相同,但可靠性问题存在共性。“不同解决方案各有优劣,为了完善技术,通过国际合作等方式实现相互借鉴、取长补短十分必要。”伍湘平说。

责任编辑:王倩
网友评论
最热评论
没有更多评论了

抱歉,您使用的浏览器版本过低或开启了浏览器兼容模式,这会影响您正常浏览本网页

您可以进行以下操作:

1.将浏览器切换回极速模式

2.点击下面图标升级或更换您的浏览器

3.暂不升级,继续浏览

继续浏览