科技日报记者 都芃
“我们前期做项目测评时,尽管做了大量优化,但模型直出的科普内容里仍存在5%的幻觉率。”7月30日,在百度健康“满天星公益计划”启动会上,百度健康医生服务部总经理李杰在回答科技日报记者提问时介绍,此前上海人工智能实验室联合中国软件评测中心发布的《医疗健康领域大模型发展分析报告》显示,当前大模型平均医学知识问答准确率仅为82%,输出内容中存在部分幻觉内容。
所谓大模型幻觉,是指大模型在并不知道正确答案的情况下“硬编”内容,甚至会凭空编出根本不存在的参考文献。此次发布的“满天星公益计划”便对大模型输出医学内容时存在的幻觉问题给出了相应解决方案。
大模型存在幻觉并不是一个新问题,但在医疗领域,任何幻觉内容都有可能导致严重后果。“我想很多医生都遇到过这种情况,患者拿着大模型查出来的结果去问诊,结果和医生说的并不一样。”李杰说,受限于大模型的底层原理,即使在进行极致优化后,5%的幻觉率目前仍然难以完全消除。
“该怎么解决这个问题?我们想出的办法是号召全行业临床医生共同参与进来,为大模型‘批改作业’。”李杰比喻,大模型输出内容就像是学生写作业。即使再优秀的学生,作业中也有可能存在一定错误,这时就需要家长、老师来对作业进行批改,纠正错题,并确保下次不再犯同样错误。因此,百度健康此次发布“满天星公益计划”,计划在人工智能生成的医疗科普内容中引入权威专家,进行人工审核,将幻觉率降至最低。
李杰透露,目前已有几十家医院和行业学/协会与百度健康进行深度合作。预计今年下半年,将吸引十万名专家为人工智能内容把关,审核超1亿条的相关词条。“如果按照传统的生产方式,要生产1亿条真实词条,在半年内完全不可能实现。但在AI技术如此发达的今天,我们可以借助AI+专家,在很短时间内生成出海量严肃医疗内容,并且更加有质量、有保障。”李杰说。
专家的力量可以让人工智能产出内容更加准确,同样,人工智能也可以大大提升医学专家的科普工作效能。“最近大家很关注基孔肯雅热病毒,我们就结合百度自身的大模型能力,把相关科普内容和近期很火的《大展宏图》音乐结合,做了文生图,并合成为视频,上线2个小时播放量突破15万,大家都很爱看。”李杰说,借助百度健康平台的AIGC(人工智能生成内容)能力、智能体能力,医生可以在很短时间内就将枯燥的科普内容转化为生动、鲜活的科普图文、数字人视频等,大大降低了医生做科普的门槛,也能吸引更多医生进入科普领域。
“过去要做一个科普视频可能需要2—3个小时,现在借助智能体、数字人技术,2—3分钟就能产出一段高质量科普视频,大大释放了医生的科普生产力。”李杰介绍,百度健康平台会基于大数据能力提供科普线索,然后通过AI生成脚本并匹配专业的素材,最终可以实现专家只输出权威、专业的内容,而具体的内容呈现过程则交给AI完成。同时,百度健康为医生打造的数字人分身,更加注重个性化内容呈现,通过引用医生的个人知识库,呈现出不同医生的个人特色,把同样的内容讲出不一样的风格,更加具有医生的个人感染力。
中国医师协会健康传播工作委员会副主委兼秘书长施琳玲认为,专业权威的科普平台不能只追求内容数量,而是要让更多精华的专业知识、有辨识度的个性化知识快速抵达患者,让更多患者受益。百度健康作为科普平台如今已成为优质内容创作者的遴选高地,“满天星公益计划”希望鼓励更多具有创作能力的医生走上平台做科普,借助平台赋能创作更多优质内容。
作为“满天星公益计划”的首站,AIGC(人工智能生成内容)审阅权威科普内容专项会在8月落地,迎来首场科普大赛。百度健康将投入千亿级流量、千卡级算力、千次以上媒体传播,全面助力合作医生、公立医院和医疗机构的内容生产与品牌建设,计划到2026年打造一万名以上千万级曝光的医生科普专家。
(百度健康供图)