科技日报记者 崔爽
大模型正在从实验室走向真实场景。当前,真正考验AI企业的已不只是参数、榜单和单点效果,而是能否把模型能力转化为稳定、可靠、可持续迭代的产品能力。
“用户需要是能长期服务真实需求的系统:理解任务、管理上下文、调用工具、处理多轮交互、完成复杂流程,并持续进化。”网易有道CEO周枫近日在接受采访时表示。
在他看来,Agent(智能体)产品的核心不是单一模型,而是Model(模型)+Harness(驾驭工程)。模型负责“思考”,Harness负责让思考可理解、可协作、可复现、可长期运行,包括上下文管理、工具调用、记忆、状态持久化、评测、循环控制、可观测性和权限治理等。
周枫分享了做好Agent产品的思考和“方法论”。
在他看来,做好Agent产品首先要面向下一代模型能力设计,不能只围绕今天的模型做功能补丁,而要让产品随模型能力提升同步变强。
其次,要优先做高智能产品。靠规则、搜索和模板能解决的问题,未必适合大模型产品化;依赖模糊判断、跨文档理解、多步骤推理和复杂协作的场景,更值得投入。教育、翻译、学习、知识处理和办公场景等正具备这类特征。
第三,要让token(词元)花得有价值。复杂任务需要模型阅读、分析、推理、调用工具和校验结果,关键不是少花,而是该花处投入,不浪费处优化。
第四,要把上下文工程当成主任务。它不是写更长的提示词,而是管理模型知道什么、不知道什么、该记住什么、该遗忘什么。
第五,工具是给模型看的产品界面。高频业务动作应收敛成少数高信号、强约束、结构化的工具,减少误选和上下文污染。
第六,用评测驱动开发。可上线的Agent,必须评测答案质量、工具调用正确率、流程完成率和安全样本通过率,并引入日志回灌。
第七,默认从单Agent开始。多Agent会带来交接、状态同步、权限分层、成本叠加和调试复杂度。多数场景中,先把单Agent做稳定、可控、可评测,更有效。
“这也是理解网易有道AI转型的重要切口。”周枫介绍,网易有道在大模型、多模态、语音、翻译和教育硬件等方向持续投入;更关键的是,有道正在把技术能力沉淀为面向应用落地的产品工程方法。
“模型是起点,真正决定AI产品能否长期交付价值的,是模型之外的系统设计、场景理解和工程闭环。”周枫表示,而未来竞争的关键,正在从“有没有模型能力”,走向“能不能把模型能力变成稳定、可持续迭代的产品能力”。

网友评论