科技日报记者 崔爽
在实体经济应用场景中,性能最好的模型并非总是最合适的,还需综合考虑推理成本等因素。选择什么模型可以兼顾效率与成本?行业还没有通用方法论,通常会经历反复试错。
针对这一问题,近日,中国联通数据科学与人工智能研究院以“能力-场景”双向驱动,在自研的模型能力边界量化基础上,梳理大模型常见应用场景,构建“典型模型-能力类别-能力等级-应用场景”映射图谱,形成《大模型选型说明书》(以下简称《说明书》),为开发者提供透明便捷的选型指导,已助力多场景应用落地,并在元景MaaS(模型即服务)平台发布。
据了解,团队调研业界主流大模型评测基准中的能力分类方法,剖析现有能力评估与实际应用需求之间的鸿沟,依托落地实践积淀,梳理出105个典型的大模型应用场景。结合典型应用场景,提出新的大模型能力分类方法,并通过分析模型的能力类别、能力等级与应用场景之间的依赖关系,构建了大模型“能力类别-能力等级-应用场景”关系映射图。《说明书》对超30款主流大模型进行了模型能力等级评定。
据介绍,作为业内首个语言大模型选型经验指南,《说明书》可以帮助开发者根据应用场景找到兼顾性能和成本的模型,且提供了每个模型能胜任的典型应用场景,为模型选型决策提供经验参考,降低大模型开发应用门槛。
目前,其已赋能电信反诈、智能工单、客服助手、手机自动驾驶、深度研究等超20个应用场景落地。中国联通数据科学与人工智能研究院表示,将持续扩充评测模型库和典型应用场景,动态更新《说明书》,确保其始终反映技术前沿与市场变化。
联通元景大模型也将继续秉承“多模共生、普惠速成、场景深耕、数智融合、安全自主”五大特性,构建多模共生的模型家族,助力行业智能化升级,加速“人工智能+”的推广应用。