深圳KernelCAT破局“天下苦CUDA久矣”

2026-03-09 13:27:16 来源: 科技日报 点击数:

科技日报记者 罗云鹏

在人工智能浪潮席卷全球的当下,算力已成为核心驱动力。然而,一个长期存在的困境是:先进的AI模型与算法,往往被束缚在特定的硬件生态之上,其中尤以英伟达的CUDA生态为甚。“天下苦CUDA久矣”,不仅是开发者面对跨平台迁移时高昂成本与复杂性的慨叹,更是中国AI产业在追求算力自主道路上必须直面的现实壁垒。

在深圳,一款名为KernelCAT的AI智能体工具进入业界视野,希望以人工智能本身的力量,来破解这一生态难题。近日,科技日报记者专访深圳市大数据研究院及其孵化的智子芯元(深圳)科技有限公司(以下简称“智子芯元”),探寻这把“破局之剑”背后的逻辑与潜力。

算子开发“三高”难题有了新解法

KernelCAT由智子芯元研发,其核心定位为高度智能化的“计算加速专家”。作为基于大模型构建、具备深度领域知识的智能体框架,其并非传统的编程工具或简单的代码生成器。

“我们的目标是让它成为随时可指挥、可协作、可信赖的专家,从人类手中接管底层工程的复杂性。”深圳市大数据研究院研究科学家、智子芯元联合创始人丁添介绍,开发者无需精通艰深的硬件架构与底层优化技术,只需通过自然语言描述需求,KernelCAT便能自主完成从理解、分析到编码、验证的全流程。

具体而言,KernelCAT瞄准AI落地中最耗时耗力的底层工程环节,核心功能覆盖三大场景。其中,算子开发是为模型创造新的计算单元,在模型迁移适配中能让模型在新硬件上快速跑起来、性能调优则支撑模型跑得更快。传统需要数天甚至数周的手工工作,可被压缩至小时乃至分钟级别。

“大模型由无数运算组成,算子(Kernel)是最基础的数学运算单元,算子的效率直接决定大模型推理/训练速度。”深圳市大数据研究院副院长张昕介绍,DeepSeek系在英伟达系统上训练,要搬到华为昇腾平台,算子就起了“翻译官”的作用。

然而,算子开发长期面临“三高”挑战:门槛高,需融合算法、硬件、编译等多领域知识;成本高,新硬件、新模型意味着推倒重来;周期长,手工开发动辄数周,追赶不上技术迭代速度。

这正是CUDA生态难以撼动的根源。英伟达用十五年构建了包含完善工具链、丰富算子库和庞大开发者社区的体系,形成了强大的生态锁定效应。

KernelCAT的破题思路,在于将“专家经验”转化为“AI可复用的智能”。它并非让大模型盲目试错,而是创新性地结合了“大模型的智能”与“运筹优化算法”。

丁添以优化华为昇腾芯片上的FlashAttentionScore算子为例介绍,KernelCAT首先理解算子的计算逻辑与硬件约束,将调优问题自动转化为一个运筹学数学模型;随后,运筹优化算法在庞大的参数空间中系统、高效地搜索最优解。最终,在无须人工干预的情况下,实现延迟降低最高22%、吞吐量提升近30%的效果。

“这标志着算子调优从传统的经验驱动,走向了算法驱动。”丁添说。

以AI之智破CUDA之壁

理论需要实践检验。在此前DeepSeek-OCR-2大模型迁移至华为昇腾平台的案例中,KernelCAT自动解决了复杂的版本依赖与环境配置难题,并精准识别出模型对CUDA专属算子的依赖,自动替换为昇腾原生实现,彻底剥离CUDA,并在完成迁移适配后,相比初始方案实现了35倍的推理加速。

丁添认为,KernelCAT是生态迁移的加速器。它通过自然语言交互极大降低门槛,接管了跨平台适配的复杂度,使得向国产芯片的迁移不再是一项令人望而却步的巨型工程。

近期,DeepSeek模型通过算法与算子优化取得突破,引发行业关注。“这也代表着算力优势并非绝对,算法与软件优化能够对冲硬件堆砌,甚至突破生态壁垒。”丁添说。

时下,算力主权已成为国家安全的重要维度。硬件层面管制的背后,软件与生态自主的紧迫性更加凸显。

“技术自主可控可快速补全国产芯片的软件能力,打破‘有芯片无生态’困局。”丁添表示,筑牢产业安全底线可确保关键领域模型迁移与优化不受制于人、掌握生态竞争主动权则能通过智能工具降低生态建设门槛,加速形成软硬协同的国产AI生态正循环。

尽管潜力巨大,但丁添认为,KernelCAT未来面临模型快速迭代的跟进压力、企业级用户对AI生成代码的信任建立,以及商业化路径探索等挑战。更重要的是,算子优化的天花板终究受限于硬件本身的能力,需要与芯片厂商深度协同。

“KernelCAT是破局的利器,但一棵树撑不起一片森林。”丁添表示,“建设一个成熟的、可与CUDA抗衡的国产AI生态,是系统工程。需要硬件持续迭代,开源社区繁荣,人才培养体系完善,政策与资本支持多方形成合力。”

(受访单位供图)

责任编辑:孙莹
网友评论
最热评论
没有更多评论了

抱歉,您使用的浏览器版本过低或开启了浏览器兼容模式,这会影响您正常浏览本网页

您可以进行以下操作:

1.将浏览器切换回极速模式

2.点击下面图标升级或更换您的浏览器

3.暂不升级,继续浏览

继续浏览