魏路 科技日报记者 王春
11月20日,“智汇医学 AI无界”浦江医学人工智能大会暨首届上海市医学人工智能应用技能大赛总结会在沪举行。本次大会共同探讨医学人工智能前沿进展、规范标准、落地路径与未来应用,集中展示中国医学人工智能进入标准化、体系化、全球化新阶段的实践成果。
现场,记者观摩了一场顶尖医疗团队与AI大模型的“人机大战”。本次对决以“胃肠道疾病诊疗”为命题,参赛队伍包括:由资深消化内、外科主任医师组成两支人类战队和两支AI战队——位列MedBench官方自建榜首的Claude模型,上海人工智能实验室联合上海交通大学医学院附属仁济医院、上海第九人民医院共同研发的胃肠疾病多模态辅助诊疗大模型。

比赛题目从31例真实案例中现场随机抽取,四组选手同时对一名因食管占位及食管静脉曲张入院的73岁女性患者病例给出诊断和诊疗计划。本次抽取的案例兼具典型性与复杂性,是一例早期胃癌同时合并有肝硬化食管静脉曲张等常规表现病例,对专业医生和AI大模型都是不小的挑战。两个AI大模型均在2分钟内给出结果,而两组人类医生的完成时间分别为12分01秒、13分50秒。AI大模型在响应速度上有显著优势。
上海市卫生健康委员会副主任罗蒙对赛题及各方表现进行了点评:在疾病诊断方面,胃肠大模型与人类医生均准确识别出核心问题,将食管肿瘤置于首要病因,病灶识别能力精准;通用模型Claude未能从胃镜图像中识别出肿瘤。在诊疗计划方面,胃肠大模型能提出内镜下检查与治疗等关键步骤,思路贴近三甲医生水平;人类医生的方案框架正确,但在针对早癌的进一步检查,可以进一步细化;通用模型Claude的方案则更偏向内科治疗,对外科手术干预等考量尚有欠缺。
“这场比赛印证了AI是医生的好助手——它能高效处理海量信息,提供循证参考,有效提升医生的诊断效率及诊疗技术。未来,AI技术与医疗深度融合,必将实现更强大的医疗服务能力,实现‘1+1>2’的诊疗效能,为守护人民健康构筑起更坚实的防线。”罗蒙说。
为进一步推动医学与人工智能融合发展,现场发布了一系列创新举措。上海人工智能实验室牵头成立了“医学人工智能评测联盟”,旨在建立统一、科学、严谨的医学人工智能评测体系,推动行业向标准化、体系化新阶段迈进;发布了全新升级的中文医疗大模型权威评测平台MedBench 4.0,这是全国首个且唯一面向垂类模型、专类模型、应用场景的医疗大模型评测与验证体系,为衡量医学AI产品性能与可靠性提供科学标尺;搭建了开源医疗大模型园区OpenMedZoo,已开放首个高可靠性医疗安全伦理推理模型SafeMed-R1、全科基层医生大模型Med-GO等多个项目。《医疗大模型应用安全实施指南》标准草案同步发布,填补我国医疗大模型安全应用标准空白,为技术创新划定安全边界、提供实践准则。
会议期间,“首届上海市医学人工智能应用技能大赛”围绕“AI+智慧医疗”“AI+智慧管理”“AI+智慧服务”三大赛道,评选出获奖团队并颁奖。

网友评论