破解通用智能体困境   “衔远大观”亮相“人工智能+”产业生态大会

2025-12-09 15:22:25 来源: 科技日报 点击数:

科技日报记者 王怡

近日,由中国互联网协会主办的2025“人工智能+”产业生态大会在北京中关村举办。在大会现场,衔远科技CTO张开颜以《衔远大观:基于强化学习的专家级智能体进化平台》为题,分享了他对于智能体技术创新与行业趋势的洞察,并介绍了基于强化学习的专家级智能体进化平台——衔远大观的核心技术、产品创新及应用落地。

针对当前通用智能体应用落地难、长尾问题处理成本高等痛点,衔远科技根据创始人周伯文教授提出的“通专融合”技术路线,构建可支撑智能体持续进化的“数字风洞”。其核心解法体现为“大观公式”,将专家能力拆解为基础模型、仿真环境与强化学习三部分,强调环境是模型进化的关键壁垒,并指出跨领域任务的强化学习可通过迁移学习促进专业能力快速提升,体现通专融合的根本价值——既实现了广度的平台化,更实现了深度的专业价值挖掘。

据了解,在技术内核层面,衔远科技自研三大引擎,一是具备课程学习能力的智能体模拟训练场,能够合成海量边缘任务案例,并依托生成式世界模型模拟环境状态;二是融合业务准则驱动生成式奖励与内在奖励的自适应反馈机制,可提供接近专家水准的反馈信号;三是基于过程奖励监督与多智能体协同的高效强化学习引擎,即使对闭源模型也能通过上下文强化学习实现经验库优化。这三者共同构成智能体从体验、评估到进化的闭环体系。

在产品架构上,衔远科技基于“衔远大观”系统构建了三层平台,涵盖数据管理、进化引擎与专家智能体管理,并将智能体划分为决策型与执行型两类,打造企业“数字员工”的入职培训与终身学习中心。

基于该平台,衔远科技已构建了多个行业的专家级智能体。在建筑行业,该公司与头部央企合作构建了“计划编制Agent(智能体)”,实现智能计划编制及智能风险预警。相比人工,计划编制时间节省70%,工期延误全面受控,并为某中型企业降本3300万元。

在生信行业,该公司与国家蛋白质科学中心合作。实测显示,其分析速度比人工快10倍,且约有25%—30%的自动生成假设,达到了研究生水平的原创性与合理性。

在供应链领域,该公司为行业头部企业构建了“国际物流多式联运路径规划Agent”。它结合大模型对多源路况的实时感知,以及运筹学求解器的最佳路径计算,将应急物流规划的时间从几小时缩短到了几分钟。

张开颜表示,数据终将耗尽,但环境可以无限生成数据。期待衔远科技与各行业合作,一起构建真正专家级别的智能体。

(受访者供图)

责任编辑:陈可轩
网友评论
最热评论
没有更多评论了

抱歉,您使用的浏览器版本过低或开启了浏览器兼容模式,这会影响您正常浏览本网页

您可以进行以下操作:

1.将浏览器切换回极速模式

2.点击下面图标升级或更换您的浏览器

3.暂不升级,继续浏览

继续浏览