图生视频大模型Vidu Q2发布

2025-09-25 16:16:05 来源: 科技日报点击数：

科技日报记者罗云鹏

9月25日，生数科技发布新一代图生视频大模型Vidu Q2。该模型在极致表情变化、推拉运镜、生成速度及语义理解方面取得进展，实现从“生成视频”到“生成演技”，从“动态流畅”到“情感表达”的跨越，让AI视频生成技术从追求“形似”进入“神似”新阶段。

当前，AI视频生成已能实现基本的动作连贯，但生成的角色往往表情僵硬、眼神空洞，缺乏细节和打动人心的情感表达，AI生成视频中的角色也常被诟病为“面瘫”或表情僵化，这成为AI行业规模化发展瓶颈。

Vidu Q2能够理解并生成细腻的面部微表情。例如嘴角不经意地抽动、眼神中一闪而过的犹豫、眉头微蹙表达的疑虑等。

生数科技首席执行官骆怡航表示：“Vidu Q2的突破在于我们首次让AI角色拥有了‘有趣的灵魂’。我们让AI学会了‘演戏’，这不仅是技术的里程碑，更是通向更高级别人工智能不可或缺的一步。”

据悉，Vidu Q2通过深度理解情感文本、图文解析，并结合对人体面部动作单元的精细解构与物理模拟，从而在视频中驱动角色面部肌肉、肢体肌肉产生符合情感逻辑的细微运动。除了微表情，Vidu Q2在生成可控及一致性等方面也有了多方位提升。

此外，首尾帧、双出片模式及2—8秒筛选等兼顾出片质量与效率的产品设计模式，网页版、App版及API同步上线的多渠道化，使得Vidu Q2能够灵活适配从高端影视制作到快速社交媒体内容生产的不同需求。

（受访者供图）

责任编辑：李梦一

网友评论

最热评论

没有更多评论了

1.将浏览器切换回极速模式