科技日报记者 崔爽
日前,智象未来团队提出全新层级自回归生成范式(Hi-MAR),有效解决自回归图像生成中结构失真问题。该研究已被ICML(国际机器学习会议)2025收录,并在多个图像生成任务中取得领先表现。
据了解,现有自回归图像生成模型存在缺乏全局结构建模能力、训练—推理分布不一致、尺度引导缺失等问题。Hi-MAR借鉴人类绘画过程,采用自顶向下层次化生成范式,还引入多尺度联合训练策略等。实验显示,其在图像质量和语义一致性上表现更好,可以提升模型的全局感知能力与生成质量。
这一全新架构为构建具备“全局感知+局部细化”能力的生成基础架构提供了新的范式,同时也为下一代多模态生成式基础架构的技术演进带来更多可能性。