可灵AI发布全新2.0模型  全球用户数突破2200万

2025-04-16 12:20:29 来源: 科技日报 点击数:

科技日报记者 崔爽

4月15日,可灵AI在北京举行“灵感成真”2.0模型发布会,正式发布可灵2.0视频生成模型及可图2.0图像生成模型。

快手高级副总裁、社区科学线负责人盖坤在会上表示,AI在辅助创意表达上拥有巨大潜力,但当前的行业发展现状还远远无法满足用户需求,要实现“用AI讲好每一个故事”的愿景,必须对基模型能力进行全方位提升,定义人和AI交互的“全新语言”。

据介绍,可灵2.0模型在动态质量、语义响应、画面美学等维度保持领先;可图2.0模型在指令遵循、电影质感及艺术风格表现等方面显著提升。3月27日,全球AI基准测试机构Artificial Analysis发布了最新的全球视频生成大模型榜单,快手可灵1.6pro(高品质模式)登陆图生视频(Image to Video)赛道榜首。

值得注意的是,本次2.0模型的迭代中,可灵AI正式发布AI视频生成的全新交互理念Multi-modal Visual Language(MVL),让用户能够结合图像参考、视频片段等多模态信息,将脑海中包含身份、外观、风格、场景等在内的多维度复杂创意,直接高效地传达给AI。

盖坤解释,MVL由TXT(Pure Text,语义骨架)和MMW(Multi-modal-document as a Word,多模态描述子)组成,能从视频生成设定的基础方向以及精细控制这两个层面,精准实现创作者们的表达。

基于MVL理念,可灵AI推出多模态编辑功能。MMW将不只局限于图片和视频,也可以引入其它模态的信息,例如声音、运动轨迹等,让用户实现更加丰富的表达。

基于MVL这一全新交互方式,快手副总裁、可灵AI负责人张迪发布全新的可灵2.0大师版,这一版本全面升级视频及图像创作可控生成与编辑能力,并上线全新的多模态视频编辑功能。

张迪介绍,可图2.0文生图能力也全面升级,包括大幅提升指令遵循能力、显著增强电影美学表现力以及更多元的艺术风格等。

数据显示,去年6月发布以来,可灵AI已累计完成超20次迭代,截至目前,全球用户规模突破2200万。来自世界各地的超1.5万开发者和企业客户,将可灵的API(应用程序接口)应用于不同的行业场景中。

为进一步激发AI爱好者们的创作热情,快手副总裁、可灵AI负责人张迪还在会上正式发起“可灵AI NextGen 新影像创投计划”,加大对AIGC创作者的扶持力度。同时,可灵AI面向全球创作者发出征集邀约,邀请用户共同打造全球首支用户共创AI创意短片。

盖坤表示,可灵AI将持续大力推动技术创新,用人与AI交互的全新语言,帮助用户实现复杂创意的精确表达。“我们的初心,是让每个人都能用AI讲出好的故事,我们也真切希望这一天更快到来。”他说。

(主办方供图)

责任编辑:王倩

抱歉,您使用的浏览器版本过低或开启了浏览器兼容模式,这会影响您正常浏览本网页

您可以进行以下操作:

1.将浏览器切换回极速模式

2.点击下面图标升级或更换您的浏览器

3.暂不升级,继续浏览

继续浏览