科技日报记者 崔爽
在日前举行的2025世界人工智能大会(WAIC)期间,智象未来(HiDream.ai)联合创始人兼首席技术官姚霆发表主题演讲,系统阐释了多模态智能体在内容创作领域的技术突破与商业化实践。他表示,作为聚焦多模态生成的AI创新企业,智象未来期待通过探索多模态大模型的有效落地形式,让创作回归灵感,让时间忠于故事,推动内容创作从工具效率提升向生产力革命跨越。
技术实力是商业化的底气。姚霆介绍,智象多模态模型以“高维理解、精准生成”为核心,构建了覆盖图像、视频、编辑的全栈能力矩阵。技术层面,智象多模态基础模型历经三次重要迭代,构建起“理解深、控制准、画质高”的核心优势,持续突破生成技术瓶颈。这些能力转化为三大核心价值:语义一致性(如IP故事活化时保持风格统一)、精准可控性(支持个性化定制与元素自由调整)、影视级画质(4K分辨率、长时序稳定输出),为专业创作提供技术保障。
在图像生成领域,HiDream系列开源模型累计下载量超60万次,被Diffusers库、ComfyUI、Recraft等主流工具集成。
在产品形态上,智象以“智能体”为核心形态,构建覆盖图像生成、视频创作、营销传播的工具链。
记者从会上了解到,智象未来即将正式发布长视频编辑智能体HiClip。针对长视频“内容过载、分发低效、回报周期长”的痛点,HiClip通过多模态语义理解,精准解构内容核心(如提取高光片段、生成音频摘要),实现“一次创作、全域适配”的二次传播。