科技日报记者 崔爽
近日,多模态生成式人工智能团队智象未来两篇技术论文被CVPR 2025(国际计算机视觉与模式识别会议)收录,论文分别关于视频生成与虚拟换装领域。
其中,MotionPro技术实现微动作精准生成,该技术改变传统视频生成模式,创新采用局部稀疏光流采样精准捕捉如眨眼、转头等微动作,结合运动掩码严格区分物体与相机运动。实验显示其视频轨迹对齐精度提升19%,实现“所画即所动”。DPIDM则是视频虚拟换装方案,该方案采用双分支扩散框架,结合动态姿势交互模块,有效解决服装细节保持与视频一致性的问题,显著提升虚拟试衣的真实感和时空连贯性,为营销场景提供真实动态试穿体验。