科技日报记者 都芃
7月2日,在百度AI Day开放日上,百度搜索宣布进行十年来最大改版,从搜索框、搜索结果页到搜索生态全面革新。从通用化到个性化,从工具化到内容化,百度搜索正主动求变。
最直接的变化是原本经典的搜索框变大,成为“智能框”,能够输入超千字长文本,还可以上传文件,并集成了AI写作、AI画图等功能。“智能框”的理解能力也大大提升,不论是旅游路线规划、方案撰写等创作类需求,还是“按照内容找一部电影”这种模糊需求,都能给出答案。
此外,“智能框”的图片、视频、音频等多模态输入能力也得到增强。比如AI相机不仅能帮用户识图、解题、翻译等,还能完成更个性化的服务。随手拍一张风景图,它可以充当导游为用户讲解;家里的电器出现故障不知道怎么描述,拍一张即可排查检修;体检报告看不懂,拍一张就能分析解读。
相应的搜索结果页也发生了重大变化,以前是给链接,现在则可以直接满足用户需求。全新升级的“百看”功能,不仅能图文、音视频共同呈现,输出结构化内容,未来还将陆续接入智能体等服务,把信息以最适配的形态送到用户面前。比如用户提问“最近有什么适合送礼的数码产品”时,过去的搜索结果只有链接,现在不仅可以帮用户把信息分门别类整理好,甚至还能在搜索页直接下单。
从信息获取到任务完成,百度搜索正在拓宽搜索能力的边界。百度搜索的“AI助手”此次也迎来重大能力升级。加入视频通话,增强语音、图片和文件等多模态输入能力;丰富多媒体输出能力,全面支持图片、视频、笔记等内容的混合排版,同时可根据用户的习惯和偏好智能调整输出结果。搭配一站式工作台,还可以实现“智能创作、实时编辑、异步交付、一键存储”的一体化能力;结合深度搜索(Deep Search)能力,“AI助手”能够模拟人类处理信息的全流程,通过思维链多级推理,结合大模型多阶段自主反思能力,为用户提供更全面更多维的答案。
此外,百度搜索还全新升级智能创作能力,一句话就能生成三分钟创意视频,视频生成后,支持分镜编辑,自定义画面内容,提供“从灵感捕捉、内容生成到全平台发布”一站式服务,大大降低了创作门槛。
百度搜索生态也在变得更加开放、丰富。目前百度搜索开放平台已收录1.8万余个优质MCP(模型上下文协议)服务应用,其中有很多已经直接可被百度搜索调用,提升了用户的搜索体验。百度搜索还接入了大量拥有闭环解决方案的AI应用,比如用户想装修,只需要描述自己的想法,就能在搜索页直接调用生境科技的AI应用,生成3D装修全景方案。
本次AI DAY上,百度搜索还宣布将接入商业研发团队自研的视频生成模型MuseSteamer,这也是全球首个实现中文音视频一体化生成的视频模型。该技术可实现画面与音效、人声台词的协同创作,打破传统AIGC视频“先画面后配音”的割裂流程。据悉,MuseSteamer具备多项技术突破:在权威榜单VBench I2V中以89.38%的成绩登顶,支持一张图生成10秒1080P电影级画质视频,人物微表情与运镜效果达专业影视水准。
MuseSteamer模型家族包含多种版本,可以覆盖从普通创作者到专业影视机构的需求。其中Turbo版已上线创作平台“绘想”并开启限时免费公测,其余版本将于8月陆续开放。平台同步启动“跨次元捏合”AI视频创作大赛,用户通过单图输入可生成动态捏捏乐视频进行参赛。
(百度供图)