科技日报记者 崔爽
2月5日,可灵AI正式全球上线3.0系列模型。此次发布的可灵视频3.0、可灵视频3.0 Omni及可灵图片3.0、可灵图片3.0 Omni模型,覆盖图片生成、视频生成、编辑及后期等影视级全流程链路,标志着AI正式进入影视与创意内容的核心生产环节,可灵AI也正式迈入3.0时代。
据介绍,可灵3.0系列模型基于All-in-One产品和技术理念构建,形成一个多模态输入与输出高度统一的一体化视频模型体系。它并非将功能简单叠加,而是通过统一架构,将影像创作中的理解、生成与编辑整合为一个连续流程,让创作首次在单一模型内完成闭环。
在这一体系下,创作者可以同时输入文字、图片、声音与视频,并直接获得可用的专业影像级输出结果,创作过程不再被拆分为多个工具与步骤。
如围绕创作者最关心的稳定性与表达力,可灵3.0系列模型通过整合视频主体上传、音色绑定等技术能力,使得人物形象、动作与声音保持稳定,文字清晰、品牌标识可识别,即便在多语言场景下,视觉风格与角色特征也能高度统一;在叙事层面,模型支持最长15秒的连续生成,并引入智能分镜与自定义镜头控制,让创作者能够直接组织镜头节奏与叙事结构。
值得一提的是,Omni版本进一步强化了角色一致性与指令响应的敏锐度。该版本让画面更少崩坏、更具灵动感,攻克了文字变形等难题,结合灵活的分镜控制能力,使AI生成内容达到专业影视的“直接交付”标准。
资料显示,自2024年6月发布面向用户的DiT视频生成模型以来,可灵AI推动行业进入“可用时代”;进入2.0阶段后,通过模型能力和表现力的持续提升,实现从“可用”到“好用”的演化:在影视和广告领域,创作者可利用智能分镜等镜头调度能力快速验证创意;在游戏与虚拟制作中,稳定的角色一致性则能大幅加速数字资产的构建。
根据最新数据,截至2025年12月,可灵AI已拥有超过6000万创作者,生成超过6亿个视频,服务超过3万家企业用户,年化收入运行率达到2.4亿美元。

网友评论