沈涵 科技日报记者 王春
筛选所有基因中的潜在靶点,从中发现帕金森病全新治疗靶点并筛选出候选药物;提前15年预测阿尔茨海默病发病风险,诊断精准性超过98.7%……近年来,复旦大学在医学领域取得系列突破。这些突破背后,都离不开云上科研智算平台CFFF提供的AI算力支持。该平台由复旦大学、阿里云等共同打造,以公共云模式提供超千卡并行智能计算,支持千亿参数的大模型训练,具有大规模、高能级的特点。
当前,AI已从一个研究领域变成一类赋能技术。多位专家近日在接受科技日报记者采访时表示,在医药健康领域,AI已应用于靶点发现、药物设计及临床试验等方面,显著提升了科研效率,同时“数据孤岛”等挑战也不容忽视。
英矽智能科技(上海)有限公司研发人员在全自动化实验室开展实验。 受访单位供图
改变药物研发模式
AI技术正在改变靶点发现模式。在传统的假设驱动研究模式下,研究者根据现有理论体系,推测某一蛋白在致病蛋白传播过程中发挥重要作用,再设计实验进行证实。这种模式不仅耗时耗力,更极易忽略现有理论体系外的诸多可能性。
在AI技术加持下,数据驱动的研究模式成为可能。这是一种不带预设的研究思路,在所有基因中筛选潜在靶点,再进行体内外基础实验加以验证,可大幅提升数据分析规模和研究效率。
“我们利用大模型技术对超过100万个样本进行了大规模全基因组关联分析,发现FAM171A2基因的5个位点突变与帕金森病风险显著相关。”复旦大学附属华山医院教授郁金泰告诉科技日报记者,病理性α-突触核蛋白是帕金森病的关键致病蛋白,此前从未有人研究过FAM171A2这种神经元细胞膜蛋白在α-突触核蛋白传播过程中的作用。
AI在化合物筛选环节的作用同样显著。
在传统研究模式下,针对高创新性靶点的药物开发需经历反复试错:研究者需从数以万计的分子中筛选出兼具活性与选择性、耐药性良好、吸收代谢特性优异且安全性达标的分子。符合这些要求的药物分子,才能进入临床阶段。这种高度依赖专家个人经验与创造力的方式往往会消耗大量时间,带来高昂人力、物力成本。而AI蛋白结构预测和虚拟筛选技术能快速预测哪些分子最有可能成为有效药物。在一些案例中,AI甚至可以在48小时内筛选1亿个化合物。
在CFFF平台助力下,郁金泰团队得以在所有基因中精准筛选潜在靶点,又从7000余种小分子化合物中快速找到一种可有效抑制FAM171A2蛋白和病理性α-突触核蛋白结合的小分子。“这一原本需要数十年才能完成的工作,我们仅用了5年。”郁金泰说。
CFFF平台也支持了团队的另一项研究。团队利用AI技术从6361种脑脊液蛋白中筛选出4种与阿尔茨海默病高度关联的蛋白。根据这些新的诊断生物标志物开展联合诊断,可提前15年预测阿尔茨海默病发病风险,且精度超过98.7%。据悉,基于该成果研发的阿尔茨海默病早筛早诊检测试剂将于今年底在各大医院和体检中心上线。
提升临床试验效率
药物在上市前,需经历临床试验,并通过药品监管部门的严格审批。“进入临床阶段后,AI筛选的药物与传统药物一样没有捷径。”英矽智能科技(上海)有限公司(以下简称“英矽智能”)联合首席执行官任峰说。
但这并不意味着进入临床阶段后,AI毫无作用。相反,这一阶段迫切需要AI介入。
传统临床试验在受试者招募、筛选、数据采集和质控等方面效率低下,这些问题导致经济和时间成本高,失败风险大。而AI可以优化患者招募标准,预测试验结果,模拟临床试验,为突破传统临床试验瓶颈提供新的思路和方法。
今年6月,某慢性阻塞性肺病长效雾化支气管扩张剂上市申请获批。在其Ⅲ期临床试验的患者招募环节,医渡科技有限公司打造的患者招募智能体大显身手,使入组速率提升超30%,且质量维度严格控制在90%以上。“该智能体的准确率较传统模式提高3倍以上。”该公司生命科学事业部智能临床试验负责人郝原说。
一些企业积极探索将AI技术用于临床试验结果预测。英矽智能利用自主研发的AI临床试验预测引擎“inClinico”,已准确预测了多项临床试验Ⅱ期至Ⅲ期的转化结果。
在临床数据管理环节,AI同样潜力巨大。上海耀乘健康科技有限公司的AuroraPrime平台能将临床研究报告初稿的生成时间减少90%,总体节省45%的时间。
AI还可以优化临床试验方案。温州医科大学李校堃院士团队利用AI优化生长因子类药物临床试验方案,成功缩短了转化周期。
AI带来的变革已渗透到临床试验各个环节。根据调研机构Precedence Research的数据,2025年全球AI临床试验市场规模将达到26亿美元,2034年预计超过223.6亿美元。
业内人士认为,AI临床试验市场正处于爆发式增长前夕,技术革新将极大提升行业运行效率。同时,值得注意的是,监管框架的滞后性与数据隐私保护、技术滥用等伦理风险是制约行业健康发展的关键瓶颈,亟需构建适应性监管体系与伦理治理框架。
面临“数据孤岛”挑战
在大数据与大知识融合的时代,算力成为重要的科研生产力。随着算力水平不断提升,科研效率也大幅上升。
复旦大学类脑智能科学与技术研究院研究员程炜对算力的跃迁感触颇深。“2011—2012年,我们买了几台机器,处理100人的影像数据已很难,一台小服务器跑了好几天。”他说,如今,CFFF平台提供了更充足算力,可以实现多任务同时计算。依托该平台,他有信心建立更大的数据库来推动研究。
程炜说,随着AI时代对算力需求的增长,以及对数据安全和隐私保护的重视,很多高校都在建立或强化自己的计算平台。“尤其是在涉及敏感临床数据的研究中,自己拥有计算平台必不可少。”他说。
但从另一个角度来说,这也会加剧数据壁垒问题。数据资源的碎片化现象,将制约“AI+医药”的技术潜能释放。“如果需要AI发挥更大作用,就要创造更多标准化数据。”晶泰智药技术(上海)有限公司联合创始人、首席执行官马健说,未来5到10年,希望行业在高质量数据生成方面投入更多精力。
“AI药企普遍使用公开数据以发展算法技术,现在数据量尚够,但随着行业进步,企业对算法精度的要求会越来越高,未来必然形成大量标准化数据缺口。”任峰说,英矽智能常年保持一支20—40人的数据挖掘团队,每天保持相关数据更新,但行业内“数据孤岛”问题不容忽视。
多位受访者认为,在“AI+医药”领域,更深层挑战在于信任机制,以及AI工具与临床工作流的融合程度。当前,制药企业与AI开发者正通过构建跨机构数据协作机制、开发可解释性AI模型及建立标准化验证与部署框架,积极推动行业开放合作。未来仍需通过进一步提升AI决策系统的透明度、制定符合临床研究规范的透明化披露标准等方式,提升临床医生与监管机构的信任。