全新架构让图像生成更有“全局视野”

2025-05-25 16:56:58 来源: 科技日报 点击数:

科技日报记者 崔爽

日前,智象未来团队提出全新层级自回归生成范式(Hi-MAR),有效解决自回归图像生成中结构失真问题。该研究已被ICML(国际机器学习会议)2025收录,并在多个图像生成任务中取得领先表现。

据了解,现有自回归图像生成模型存在缺乏全局结构建模能力、训练—推理分布不一致、尺度引导缺失等问题。Hi-MAR借鉴人类绘画过程,采用自顶向下层次化生成范式,还引入多尺度联合训练策略等。实验显示,其在图像质量和语义一致性上表现更好,可以提升模型的全局感知能力与生成质量。

这一全新架构为构建具备“全局感知+局部细化”能力的生成基础架构提供了新的范式,同时也为下一代多模态生成式基础架构的技术演进带来更多可能性。

责任编辑:王倩

抱歉,您使用的浏览器版本过低或开启了浏览器兼容模式,这会影响您正常浏览本网页

您可以进行以下操作:

1.将浏览器切换回极速模式

2.点击下面图标升级或更换您的浏览器

3.暂不升级,继续浏览

继续浏览