冯妍 科技日报记者 王春
“2025全球开发者先锋大会”将于2月21日至23日在上海徐汇举办,这是一个开发者的盛会。近日,记者走访多家参会人工智能企业,发现企业们对开源生态的热情普遍高涨。
提及大模型,大多数人都会想到春节期间“火爆出圈”的Deepseek,其开源发布冲击了大模型业界的闭源生态,带来百度开源文心一言、OpenAI官宣GPT-5免费等头部企业重大调整。眼下,Deepseek热度不减,而一个接一个的优秀大模型开源更是为这波开源浪潮添火加薪。
阶跃星辰是2023年成立的AI初创公司。2月19日,阶跃星辰开源了两款阶跃Step系列多模态大模型——Step-Video-T2V视频生成模型和Step-Audio语音模型。Step-Video-T2V模型的参数量达到300亿,可以直接生成204帧、540P分辨率的视频,生成内容具有高信息密度并保持一致性。Step-Audio是开源语音交互模型,能够根据不同的场景需求生成情绪、方言、语种、歌声和个性化风格的表达,能和用户进行高质量对话。
谈及对开源生态的看法,阶跃星辰副总裁李璟说:“我们深切感受到开源社区的蓬勃生机和无限潜力。当我们提出本次开源计划时,很多生态伙伴都在第一时间给予了支持,云厂商、芯片厂商、内容生产社区……都迅速、自发、热情地完成适配、部署等方面的工作。”据介绍,阶跃星辰是第二次参加开发者先锋大会,将举办自己的生态大会和分论坛,和开发者们面对面地交流。
近期同样发布了开源大模型的还有稀宇科技。稀宇科技成立于2021年,旗下拥有文本、语音、视频等多种模态模型。稀宇科技在2025年1月发布并开源了新一代MiniMax-01系列模型,其算法架构的独特创新大幅减少了大模型的算力成本。稀宇科技副总裁刘华认为:“优秀大模型的持续开源,能推动我们的行业发展,让社会大众普遍体验到高水平大模型的能力,吸引更多的开发者一起参与大模型的研发。”在本次开发者大会上,稀宇科技将和开发者一起探讨如何应用其开源模型,并对其进一步优化迭代。
开源的不只有大模型,还有面向程序开发者的工具。商汤科技将在本次大会上发布一站式开源Agent应用开发框架——LazyLLM,这一框架弥补了国外类似工具的不足,同时确保软件自主可控。
商汤大装置产品总监刘叶枫介绍说:“LazyLLM能让开发者像搭积木一样,把意图识别、知识库检索能力、大模型能力等快速拼到一起,实现完整应用。例如同样开发一个网购客服机器人,传统方法可能需要开发者花费一周时间串联快递查询、智能客服、转接人工等各个功能,而在LazyLLM的帮助下,大模型能够快速识别开发者的意图,开发者通过简单的操作即可实现想要的功能。”
在开源生态下,后续商汤科技会拉动更多的开发者,一起持续构建LazyLLM,扩展大模型应用生产的生态。“在本次开发者大会上,我们还会面向行业领域发布相关的定制化工具,帮助开发者更快形成具有实际价值的应用。”刘叶枫说。