科技日报记者 罗云鹏
9月25日,生数科技发布新一代图生视频大模型Vidu Q2。该模型在极致表情变化、推拉运镜、生成速度及语义理解方面取得进展,实现从“生成视频”到“生成演技”,从“动态流畅”到“情感表达”的跨越,让AI视频生成技术从追求“形似”进入“神似”新阶段。
当前,AI视频生成已能实现基本的动作连贯,但生成的角色往往表情僵硬、眼神空洞,缺乏细节和打动人心的情感表达,AI生成视频中的角色也常被诟病为“面瘫”或表情僵化,这成为AI行业规模化发展瓶颈。
Vidu Q2能够理解并生成细腻的面部微表情。例如嘴角不经意地抽动、眼神中一闪而过的犹豫、眉头微蹙表达的疑虑等。
生数科技首席执行官骆怡航表示:“Vidu Q2的突破在于我们首次让AI角色拥有了‘有趣的灵魂’。我们让AI学会了‘演戏’,这不仅是技术的里程碑,更是通向更高级别人工智能不可或缺的一步。”
据悉,Vidu Q2通过深度理解情感文本、图文解析,并结合对人体面部动作单元的精细解构与物理模拟,从而在视频中驱动角色面部肌肉、肢体肌肉产生符合情感逻辑的细微运动。除了微表情,Vidu Q2在生成可控及一致性等方面也有了多方位提升。
此外,首尾帧、双出片模式及2—8秒筛选等兼顾出片质量与效率的产品设计模式,网页版、App版及API同步上线的多渠道化,使得Vidu Q2能够灵活适配从高端影视制作到快速社交媒体内容生产的不同需求。
(受访者供图)