科技日报记者 张佳星
“犹如把原油提炼成汽油,海量的原始数据需要治理和标注,才能转化为支撑AI训练、赋能千行百业的高质量数据集。”在3月19日国家医保局召开的全国医保影像AI识图大赛新闻发布会上,国家医保局大数据中心主任付超奇表示,当前医保相关信息数据已累计达2.73万亿条,总容量达到了4.11PB,本次大赛将“以赛炼数”推动丰富医保数据资源转化为数据要素的进程。
国家医保局方面表示,全国医保影像AI识图大赛是国内首个国家级深度融合医保业务、医学影像、人工智能三大领域的创新型专业赛事,首创开放万级医保真实世界高质量影像数据集,搭建行业首个全流程实战平台,实现真训练、真验证、真输出。
“大赛设置的赛道对应的是我国发病情况较为显著、疾病负担重的病种。”付超奇说,基于CT的肺癌智能检测、基于CT的肾癌智能检测等6个赛道的设置,将进一步挖掘AI技术在相关病种的辅助诊断作用,提升高发疾病的早期诊断精准度。此外,基于胸部X光的多种疾病智能检测赛道则要求AI具备多种任务的完成能力,基于超声的甲状腺癌智能检测赛道则要求AI能够从视频中识别并判断病变。
“主办方将为参赛者统一提供训练数据集和独立测试集,比赛数据集和硬件支撑环境均达到全球同类赛事的领先水平。”付超奇介绍,此次每个赛道的数据集均达到万例规模,数据集中还包括从国内各大医院收集的罕见病例影像,这些对于AI训练都是难得一见的宝贵资料。
作为大赛的共同主办方,广西壮族自治区人民政府副主席眭国华介绍,大赛筹备阶段,广西已经形成了本地化的数据治理和标注能力,规范医学影像数据采集,并建立了标注标准。
高质量数据集是数据有序应用的基础,也是医学影像数据要素实现市场化和价值化的前提。“我们现在正在加快建设医保影像云平台,上传近5年的历史影像数据,构建规模达3000万例的标准化影像数据集,建成不少于5个符合国家医疗数据标准的标注数据集。”眭国华说。
数据要在场景落地中才能见实效。为此,广西将通过配套的政策支持助力比赛优秀成果的转移转化。“我们设立了AI+医学影像成果转化专项,对大赛的优秀获奖成果给予经费支持,并将其纳入第二类医疗器械优先审评审批通道。”眭国华介绍,成果与企业对接后,不仅会对突破关键核心技术产业化项目给予最高2000万元的支持,还会为项目的后续成长提供医学影像、AI软件研发、硬件制造、数据标注等产业链支持,促进上下游协同创新。
“大赛为健康领域、数据要素和人工智能深度融合提供了绝佳的结合点和实践载体。”付超奇表示,主办方将推动优秀成果的快速对接,助力创新成果迅速释放巨大的市场价值和社会价值,促进医药健康、临床科研、数字产业、金融服务、社会治理等多领域深度融合协同升级。

网友评论