科技日报记者 李均
记者12日从上海漕河泾新兴技术开发区获悉,园区孵化企业上海云梧智能科技有限公司科研团队Feeling AI取得新突破,其自研的CodeBrain-1在GPT-5.3-Codex底座模型的加持下,以72.9%的惊艳战绩跃升Terminal-Bench全球榜单第二,成为前十强中唯一的中国新锐。
据了解,Terminal-Bench是由斯坦福大学与Laude Institute联合打造的开源基准,被公认为是智能体在真实命令行环境下端到端执行能力的硬核标准。这一突破不仅打破了美系巨头的绝对垄断,更标志着中国AI在 Agentic AI(智能体AI)复杂任务规划与自主编码领域的工程化能力已达到世界顶尖水平。
值得一提的是,Feeling AI团队本周先后发布了MemBrain1.0与 CodeBrain-1两项成果,这是一套从“记忆”到“行动”的完整技术闭环,共同解决大模型从“能说会写”到“能做、会做、持续做”的核心瓶颈。其中,MemBrain1.0在大模型记忆能力的多项主流基准评测中拿下SOTA(最高水准)评价,反超全球多个记忆系统和算法模型。强大的记忆能力以及适配模型原生的层级化记忆系统,意味着Agentic AI正从模型能力逐步走向用户体验层面的范式跃迁。
中国农历新年前夕,全球顶尖AI公司陆续发布最新模型成果。Anthropic发布Claude Opus 4.6,OpenAI则以GPT-5.3-Codex强势回应,但在平静的水面之下,技术实力较量的底层逻辑正在悄然变化。不同于AI上半场模型在参数和对话能力方面的博弈,竞争格局正突变为残酷的实战进化,如何在闭环环境中自我进化,已成为衡量模型工程能力的终极标尺。
当前,全球AI巨头纷纷将目光锁定于模型商业化落地的“最后一公里”。业内人士指出,在OpenAI与Anthropic构建的巨头生态中,中国团队选择以“框架定义者”的角色切入,展现了中国AI创新路径的独特性与韧性。一个能驾驭全球顶尖模型的中国框架,正是AI时代最核心的智能中枢。作为一家中国初创团队,Feeling AI能在OpenAI尖端模型发布的瞬间完成深度整合,并跑出全球领先的战绩,这不仅是工程响应速度的胜利,更是中国AI团队在全球工程化协同中占据制高点的有力证明。

网友评论