机器学习可预测基因组修复结果 实现精准、无模板CRISPR-Cas9编辑

2018-11-09 14:04:06 来源: 科技日报 作者: 张梦然

科技日报北京11月8日电 (记者张梦然)英国《自然》杂志8日在线发表了一项人工智能及生物技术研究:科学家报告了一种方法,可通过机器学习对致病基因变异实现精准且可预测的编辑。这项成果为研究遗传疾病,开发潜在疗法提供了新的可能性。

虽然CRISPR-Cas9彻底改变了用于研究的基因组编辑技术,但目前认为,保证这项技术的准确性尤其重要。

CRISPR-Cas9基因组编辑常用DNA“模板”来确保DNA修复的准确性,或将特定的DNA序列导入基因组中。因此,缺少这些模板的DNA修复常被认为不够准确。

现在,美国布列根和妇女医院及哈佛医学院科学家理查德·舒尔伍德及同事,发明了一种用机器学习预测基因组修复结果的方法,实现了精准的无模板Cas9编辑。研究团队用一个含有近2000对Cas9向导RNA(gRNA)和人体DNA靶点的数据库,训练了一个名为inDelphi的机器学习模型。

经该模型识别,5%—11%靶向人体基因组的Cas9向导RNA能在超过50%的情况下(被称为“精准-50”)产生单一且可预测的修复结果。inDelphi还能利用无模板Cas9编辑识别并预测出合适的致病基因变异靶标,包括一些曾被认为无法用该方法找到的靶标。

最后,研究团队通过实验证明,人体细胞中与赫曼斯基—普德拉克综合征(HPS、白化病综合征的一种)、Menkes病(又称毛发灰质营养不良)以及家族性高胆固醇血症这三种疾病有关的近200种致病变异,其编辑和修复的准确性都能达到精准-50的标准。

研究人员表示,这一结果建立了一种实现精准、无模板基因组编辑的方法。

总编辑圈点

我们可以把CRISPR-Cas9基因编辑技术看作是一种纳米级的“工具包”,它最好能按照我们的需要,在特定位置上对DNA进行剪切修改。但实际操作时,这家伙却可能会出现意外——在错误的基因上动手脚——也就是产生“脱靶效应”,进而带来一些严重后果。现在研究人员开发出这套机器学习算法,不仅能提高该技术的基因组编辑效率与特异性,还将让技术更加准确,最大限度降低风险。

责任编辑: 夏青