科技日报记者 吴纯新 通讯员 朱盈盈
9月21日,为期六天的第十九届国际文档分析与识别大会(ICDAR 2025)在湖北武汉顺利闭幕。作为全球文档分析与识别(DAR)领域旗舰会议,本届大会汇聚了来自中国、法国、西班牙、德国、日本、印度、美国、英国等31个国家和地区的431位学术与产业界代表。
华中科技大学、中国科学院自动化研究所、中国科学技术大学、武汉大学、华南理工大学、清华大学、南开大学等知名高校,以及合合信息、百度、WACOM等行业领先企业悉数参会,共同见证DAR在大模型与多模态时代的前沿突破与应用落地。
据了解,本届大会由中国科学院自动化研究所刘成林研究员、意大利佛罗伦萨大学Simone Marinai教授、印度统计学院Umapada Pal教授和华中科技大学白翔教授共同担任大会主席;北京科技大学殷绪成教授、西班牙巴塞罗那自治大学Dimosthenis Karatzas教授以及美国理海大学Daniel Lopresti教授担任程序主席。
今年ICDAR共收到314篇论文投稿,最终录用40篇口头报告与102篇海报论文,录用率45.2%。论文主题横跨文档布局分析、手写识别、历史文档分析、文档合成、多模态文档理解模型、自然语言处理应用于文档理解、文档可信性与溯源、拍照文档方法和字体分析等方向,展示了DAR在模型规模化、任务复杂化与数据多样化背景下的系统性进展。
会前四场教程聚焦字符的多维度特征、甲骨文处理、多模态文档理解大模型的训练范式、历史文档分析等跨学科议题;会后七场研讨会继续延展到数学推理、机器学习、图形识别、视觉文本生成与文本图像处理、文档取证、多模态文档理解、低资源语言文档分析等关键主题,为参会者提供了纵深对话的学术空间。
三场主旨演讲成为大会焦点。来自大阪公立大学的Koichi Kise教授以“From AI to AI – Why Document Analysis and Recognition Stands Out:A Personal Perspective”为题,从个人的长期研究脉络出发,勾勒出DAR在AI浪潮中的独特地位——它既关乎感知层面的文字与版面解析,也关乎知识层面的语义组织与结构化表达,更在工业级流程中承载精度、效率与可追溯的多重要求。报告强调,文档不是“图片上的文字”这么简单,而是人类知识的载体,包含布局、图表、公式、表格、注释等多层语法。
大会还颁发了多项奖项,以表彰在文档分析与识别领域做出突出贡献的研究团队。ICDAR将继续以开放协作、标准共建与应用创新为引擎,推动DAR迈向更智能、更可信、更可持续的新阶段。第二十届ICDAR会议计划于2026年在维也纳举办。
(受访单位供图)