科技日报记者 杨雪
11月5日,在第7届小鹏科技日上,小鹏汽车围绕“物理AI”发布四项重要应用,包括小鹏第二代VLA大模型、小鹏Robotaxi、全新一代IRON人形机器人,以及汇天两套飞行体系。与此同时,小鹏汽车的定位升级为“物理AI世界的出行探索者,面向全球的具身智能公司”。
小鹏汽车董事长、CEO何小鹏表示,在物理世界,电力取代石油成为主力燃料,新能源正在颠覆汽车百年工业。当数字世界和物理世界融合,将催生“物理AI”。基于近十年的技术积累,小鹏构建了全栈自研的物理AI体系,覆盖芯片、操作系统(大模型)、智能硬件等多个领域。这一体系的构建,将为其在AI汽车、Robotaxi、人形机器人、飞行汽车等具身智能载体上的落地提供技术底座。
在何小鹏看来,未来大模型会成为“物理AI世界的操作系统”,也是一切物理AI应用的基础。在AI领域,“大算力+大数据+大模型”的组合,已被行业证实能让AI以超乎想象的速度演化并自我颠覆。
本次科技日,小鹏汽车正式推出第二代VLA大模型,创新性地去掉了“语言转译”环节,首次实现从视觉信号到动作指令的端到端直接生成,彻底颠覆了行业传统的“V-L-A”架构,探索全新物理模型范式。它也是小鹏首个量产物理世界大模型,既是动作生成模型,也是理解和推演的物理世界模型,还能在理解真实世界交互规律的同时,进行自我演进式学习。该模型可跨域驱动汽车、Robotaxi、机器人、飞行汽车。
在模型训练层面,小鹏第二代VLA可以直接利用海量的真实驾驶视频进行训练,无需任何人工数据标注。用于第二代VLA的数据训练量接近1亿clips(指记录了驾驶行为的视频片段),相当于人类司机驾驶65000年才能遇到的极限场景总和。基于对物理世界的理解,第二代VLA可推演未来决策场景,并能基于此生成更真实的长尾场景进行对抗训练,从而大幅提升应对长尾问题的能力。
将小鹏第二代VLA部署到车端,极其考验软硬件协同和工程化落地的能力。为实现第二代VLA量产上车,小鹏汽车针对图灵AI芯片重新开发了针对性的编译器和软件栈。得益于“芯片—算子—模型”全链路优化,小鹏汽车最终做到了在2250TOPS(处理器运算能力单位)的Ultra版车型上,搭载数十亿级参数规模的第二代VLA,而行业普遍车端模型参数量仅为千万级规模。

网友评论