科技日报记者 崔爽
“视频生成技术距成熟尚存在叙事性、稳定性、可控性三方面突破点,行业正等待‘ChatGPT时刻’。”日前举办的第七届北京智源大会大模型产业CEO主题论坛上,智象未来创始人兼CEO梅涛表示。
梅涛介绍,团队探索3D与2D结合以突破“复制困境”,并通过“模型-内容-效果”的价值闭环构建商业生态。其提出的从“复制世界”到“理解世界”的演进路径,为多模态大模型技术与商业化突破提供新思路,也为AI产业化发展指明方向。
在他看来,无论是做视频生成还是大模型,最关键的挑战在于如何从技术能力出发,走到一个可持续、可闭环、有现金流的商业模型中去。如果无法实现这一点,终究只能停留在“技术提供者”的角色。而对于多模态大模型为用户提供的价值,他认为,当下更重要的是提供一站式解决方案,而非让用户拼凑工具。从而可以实现把复杂留给自己,把简单留给客户,用工具降本增效后直接交付价值。
“未来随着技术的深度融合、生态体系的持续完善,多模态大模型必将推动内容创作进入人机协同的新阶段,为数字经济发展注入全新动能。”梅涛说。