多模态机器学习模型AlphaCD创新基因编辑工具设计路径

2025-08-27 20:08:13 来源: 科技日报 点击数:

科技日报记者 马爱平

记者27日从中国农业科学院获悉,该院农业基因组研究所农业基因编辑技术研发与应用创新团队构建了全球规模最大的实验验证数据集,并基于此开发出多模态机器学习模型AlphaCD。该模型不仅能高效预测超过2万余种胞嘧啶脱氨酶的酶活特征,还能设计出新型高性能碱基编辑工具。相关成果日前发表于国际期刊《细胞研究》。

胞嘧啶碱基编辑器是一种基因编辑工具,广泛应用于疾病治疗、动植物育种等研究领域。“然而,传统胞嘧啶碱基编辑器研发依赖大量试错实验,成本高、周期长,且难以系统优化酶活特征。”论文通讯作者、中国农业科学院农业基因组研究所研究员左二伟表示。为破解这一难题,研究团队历时三年,实验测试了1100种胞嘧啶脱氨酶变体的催化效率、脱靶效应等核心指标,首次建立了覆盖多维功能特征的大规模实验数据库。

微信图片_20250827084659_804_551.png

基于该数据库,团队整合蛋白质序列、三维结构、理化性质等多模态数据,开发出人工智能模型AlphaCD。经严格验证,该模型在预测胞嘧啶脱氨酶催化效率、脱靶活性、靶向窗口及基序偏好等关键指标时,准确性显著优于传统方法。

“AlphaCD突破了当前AI大模型依赖超算资源的局限。”左二伟介绍,研究团队采用随机森林算法发现,在个人计算机上即可完成模型训练。这一轻量化设计使学术机构低成本开展高通量功能预测成为可能,降低了技术门槛,为资源有限的科研团队提供了新思路。

责任编辑:陈可轩
网友评论
最热评论
没有更多评论了

抱歉,您使用的浏览器版本过低或开启了浏览器兼容模式,这会影响您正常浏览本网页

您可以进行以下操作:

1.将浏览器切换回极速模式

2.点击下面图标升级或更换您的浏览器

3.暂不升级,继续浏览

继续浏览