科技日报记者 杨雪
近日,大晓机器人联合南洋理工大学S-Lab发布全球首个统一物理3D生成框架PhysX-Omni。该成果重构了具身智能训练数据的生产模式,让AI生成的3D资产无需人工调试即可直接部署至物理模拟器,大幅加速机器人交互策略的迭代速度,推动通用机器人从“感知智能”向“物理智能”跨越。
研究团队跳出传统3D生成“先外观后物理”的割裂思路,从具身智能的真实训练需求反向推导技术路径,确立了“统一建模+显式物理表征”的核心研究方向,首次实现刚体、可形变物体与关节物体的一体化物理建模,能同时生成绝对尺度、材料属性、运动学参数、交互能力等核心物理信息,让AI生成的3D模型真正做到“生成即可仿真”。
该框架的核心突破在于首创面向视觉语言模型的模板化游程编码几何表征。受经典二维游程编码启发,团队先将3D资产体素化并按部件层级拆分,再沿Z轴切分为二维二值掩码进行紧凑编码;同时引入模板层概念,让结构相似的切片共享基础模板、仅记录残差变化,既保留了精细几何信息,又大幅压缩了词元数量,从而避免引入分割步骤带来的误差。
此前,绝大多数3D生成方法仅能输出静态几何与视觉效果,无法还原真实世界的物理属性与运动规律,生成的模型一进入仿真场景就会出现穿模、尺寸错乱、关节失效等问题,完全无法支撑物理交互与机器人训练需求。PhysX-Omni通过采用统一物理3D生成技术,实现从文本描述到可直接仿真的物理资产的端到端生成,为具身智能提供了规模化、低成本的训练数据解决方案。除单个物体外,它还支持从2D图像或文本描述生成完整的仿真就绪场景,可快速搭建家居、工业、办公等多样化交互环境,满足机器人导航、操作、协作等复杂任务的训练需求。
通过3D布局与可交互物体结合来构建符合真实物理规律的完整室内外场景,为机器人导航、多智能体协作、复杂环境交互等高阶任务提供了多样化的训练环境,同时也为具身智能构建对物理世界的全局认知、实现通用世界建模奠定了重要基础。

网友评论