百度伐谋Agent 2.0登顶权威榜单  AI工程化能力再获验证

2026-04-10 20:45:57 来源: 科技日报 点击数:

科技日报记者 都芃

日前,百度智能云推出的企业级算法自主优化智能体——百度伐谋Agent 2.0,再次登顶机器学习工程权威基准测试榜单MLE-Bench,并刷新SOTA(最优)成绩。这是继去年10月首次登顶后,百度伐谋凭借顶尖的工程能力再一次领跑全球。据悉,百度伐谋2.0将在今年5月的Create 2026百度AI开发者大会上正式发布。

由OpenAI主导设立的MLE-Bench是检验智能体“动手能力”的硬核考场。它包含75个来自Kaggle竞赛的真实工程难题,重点考察人工智能在模型训练、数据准备、实验运行等机器学习全流程中的端到端实战能力。作为一个寻找最优解的智能体,百度伐谋对于具有明确评价标准的问题,能像顶尖算法工程师一样,完成从需求理解到最优解输出的全链路自动化,寻找全局最优解。去年10月,百度伐谋发布即登顶MLE-Bench。

评测显示,在统一运行标准下,百度伐谋2.0在“高难度”任务上的综合胜率显著领先,超越搭载国内外众多主流大模型的同类智能体,再次印证了百度伐谋在系统性分析复杂问题、迭代优化解决方案方面的成熟能力。

据了解,百度伐谋2.0在演化策略、长程记忆机制、底层基础设施等层面进行了全面优化。其中,增强的演化策略能够让智能体在多条路径上并行探索,适时回溯调整,从而找到更优的解决方案;长程记忆机制能够帮助智能体像人类工程师一样,在长链条任务中思路清晰、逻辑一致;百度智能云全栈AI云基础设施优化则让算法演化迭代的效率显著提升。

同时,百度伐谋2.0还大幅降低了算法使用门槛,即便没有算法背景的业务人员,也能以自然语言和数据文件发起需求,系统自动交付可解释、可交互、可落地的决策方案。

百度伐谋上线至今已吸引数千家用户企业,覆盖零售、金融、制造、能源、交通等国民经济关键领域。例如,在汽车制造领域,阿尔特太乙与百度伐谋合作研发御风智能预测系统,将单次风阻验证时间从10小时压缩至数分钟,整车研发周期平均缩短25%;在能源基建领域,中国能建广东院用伐谋解决海上风电电缆桥架布置难题,节省近一周工期与大量材料成本。

百度伐谋在科研场景同样展现出巨大应用价值。北京工业大学团队将其引入中国空间站微型气相色谱柱设计实验,以自动化寻优代替人工反复仿真,大幅提升分离效率。为进一步降低科研团队使用门槛,百度智能云近期还开源了Famou for Science项目,可基于多智能体协同模式构建完整虚拟科研团队,支持长线程科研任务的自动化推进。

从MLE-Bench榜单登顶到千行百业应用,百度伐谋2.0象征着中国AI正在算法工程领域持续深耕,不断突破。

(受访单位供图)

责任编辑:孙莹
网友评论
最热评论
没有更多评论了

抱歉,您使用的浏览器版本过低或开启了浏览器兼容模式,这会影响您正常浏览本网页

您可以进行以下操作:

1.将浏览器切换回极速模式

2.点击下面图标升级或更换您的浏览器

3.暂不升级,继续浏览

继续浏览