科技日报记者 罗云鹏
“崖山、采石矶、顺昌、宁远、钓鱼城、伏波、去病、梦溪……”一个个兼具东方意象之美的名称背后,是深圳计算科学研究院(以下简称深算院)成立6年来,以自主创新为根基,以解决实际需求为导向,在数据库系统、数据质量治理、智能分析领域实现的一系列关键技术突破。
崖山数据库系统行业影响跃升
崖山数据库系统(以下简称崖山)通过攻克多节点协同下高并发事务处理的稳定性难题,成功将共享集群扩展至4节点规模,提供与国外系统相当的内核性能和高可用性保障。
在TPCC基准测试中,崖山4节点共享集群于全国产化环境下实现618tpmC的峰值性能,达到非国产环境下Oracle RAC同等水平,并突破性实现故障切换时间缩短至30秒以内。
目前,崖山已在金融、能源、政务等关键领域多个核心系统上线。以深圳环境水务集团线上服务平台为例,崖山攻克软硬件兼容、适配、优化等难题,仅用8小时实现对Oracle平滑完整替换及功能验证,实现查询性能提升40%以上、系统资源利用率减少50%,助力350万用户智慧用水。
而在资质与行业认可层面,崖山已通过“分布式数据库金融标准验证测试”、商用密码产品认证、“IT产品信息安全认证证书EAL4+级”认证等多项测试和认证。
采石矶数据质量系统加速数据要素化进程
采石矶数据质量系统(以下简称采石矶)是深算院自主研发的智能数据质量系统,通过创新性引入可控人工智能技术,实现大数据错误自动发现、正确性自动修复,改变数据治理高度依赖人工与业务经验、无法应对海量数据的困境。
基于采石矶衍生的“顺昌”语料准备系统,聚焦非结构化数据的解析与提取、人机协同标注、文本语料智能清洗等核心方向,生产和加工高质量数据集。
值得一提的是,“顺昌”在文本数据的算法辅助标注准确率达到53%,提速人工智能数据的高质量发展和全方位各领域高水平应用。
与“顺昌”不同,“宁远”是一款数据合规系统,可支持企业私有数据在明文不流出前提下,具备合规提供数据服务能力。
目前,采石矶已为上海数据交易所数据评估和数据交易流程提供底层能力支撑。
钓鱼城数据分析系统驱动工业界变革
深算院率先提出“逻辑推理+机器学习”全AI技术路径,研发的钓鱼城数据分析系统,创新性实现可控人工智能技术对大数据的自动关联分析。
据了解,该系统获得科技部举办的全国颠覆性技术创新大赛领域赛“优胜奖”以及总决赛“优秀奖”,并衍生出“伏波”“去病”“梦溪”等多个行业级应用。
其中,“伏波”配方设计系统可精准平衡成分、成本与性能,让复杂配方设计效率提升80%,实现目标产品“感观一致性”以及“功效协同性”。“去病”系统则接入多源医药数据,构建靶点、药物、疾病、通道的海量数据大规模图,通过分子通路分析与鉴定,预测和估计疾病网络、蛋白质-蛋白质互作用和药物-靶点关系的总体拓扑。
此外,在动力电池制造领域,“梦溪”智能分容系统成为国内外首个攻克磷酸铁锂、三元锂等锂电池容量精准预测的可控技术及稳定系统,可高质量实现产线监控及异常溯源、低容电芯筛选、智能分容推断等功能,并有效优化动力电池企业生产线流程,减少设备、提升产能。
(受访单位供图)