美团 LongCat-Video正式发布并开源

2025-10-28 14:04:08 来源: 科技日报 点击数:

科技日报记者 崔爽

10月27日,美团LongCat团队发布并开源LongCat-Video视频生成模型。据介绍,作为基于Diffusion Transformer(DiT)架构的多功能统一视频生成基座,LongCat-Video创新通过“条件帧数量”实现任务区分,原生支持三大核心任务:文生视频无需条件帧、图生视频输入1帧参考图、视频续写依托多帧前序内容,且无需额外模型适配,形成“文生/图生/视频续写”完整任务闭环。相关技术报告显示,其在长视频生成领域具备显著优势。

近年来,“世界模型”(World Model)因让人工智能真正理解、预测甚至重构真实世界,被业界视作通往下一代智能的核心引擎。作为能够建模物理规律、时空演化与场景逻辑的智能系统,“世界模型”赋予人工智能“看见”世界运行本质的能力。而视频生成模型有望成为构建世界模型的关键路径——通过视频生成任务压缩几何、语义、物理等多种形式的知识,人工智能得以在数字空间中模拟、推演乃至预演真实世界的运行。

因此,美团LongCat团队认为,此次发布的视频生成模型,是为探索“世界模型”迈出的第一步。未来,凭借精准重构真实世界运行状态的能力,LongCat模型也会融入公司近年来持续投入的自动驾驶、具身智能等深度交互业务场景中,成为更好连接“比特世界”和“原子世界”的技术基础。

责任编辑:聂慧敏
网友评论
最热评论
没有更多评论了

抱歉,您使用的浏览器版本过低或开启了浏览器兼容模式,这会影响您正常浏览本网页

您可以进行以下操作:

1.将浏览器切换回极速模式

2.点击下面图标升级或更换您的浏览器

3.暂不升级,继续浏览

继续浏览