科技日报记者 何沛苁
当前机器人场景应用研究仍停留在“单层样板间”,而写字楼多楼层配送、家庭跨空间家务等长时程、跨楼层任务,才是具身智能走向现实的关键考验。
近日,由智元牵头,联合清华大学、麦吉尔大学完成的研究成果MANSION,全球首次提出面向整栋建筑的语言驱动多楼层3D场景生成框架,构建大规模场景生态系统,为具身智能落地复杂现实环境打造了关键“数字试验场”。相关成果入选计算机视觉与模式识别领域国际顶会CVPR 2026。

不同于简单的房间拼接,MANSION先对整栋建筑进行功能分区、垂直交通与整体风格规划,再逐层生成拓扑结构与房间布局,通过几何求解生成符合物理约束的建筑平面图,最终输出可直接在仿真器中运行的交互式3D场景。这一方式从源头保证了楼梯、电梯、跨层结构对齐合理,让生成的建筑连贯可用。
MANSION不仅能“生成楼宇”,更能让机器人“顺畅跑起来”。研究团队对3D室内模拟器AI2-THOR进行升级,集成了楼梯、电梯等模块,并推出高级原子技能应用程序编程接口,封装跨场景切换与状态管理能力,实现楼层间无缝跳转、精准落位,可高效完成跨楼层取物、运送等长链任务。
智元合伙人、高级副总裁、通用业务部总裁王闯表示:“MANSION 为全球研究者提供了首个标准化楼宇级测试平台,让机器人在更真实的复杂环境中探索空间理解、记忆规划、长期任务等能力,成为下一代具身智能实现突破的关键基石。”

网友评论