科技日报记者 崔爽
9月1日,美团正式发布LongCat-Flash-Chat模型,在Github、Hugging Face平台开源,并同步上线官网。
据悉,LongCat-Flash采用创新性混合专家模型(MoE)架构,总参数560B,实现计算效率与性能的双重优化。根据多项基准测试综合评估,作为一款非思考型基础模型,LongCat-Flash-Chat在仅激活少量参数的前提下,性能比肩当下主流模型,尤其在智能体任务中具备优势。此外,因为面向推理效率的设计和创新,LongCat-Flash-Chat具有更快的推理速度,更适合耗时较长的复杂智能体应用。
今年以来,美团AI进展频传,发布了AI Coding Agent(编程智能体)工具NoCode、AI经营决策助手袋鼠参谋、酒店经营的垂类AI Agent美团既白等多款AI应用。此次模型开源是其Building LLM(构建大语言模型)进展的首度曝光。
另外,针对智能体(Agentic)能力,LongCat-Flash自建了Agentic评测集指导数据策略,并在训练全流程进行全面优化,包括使用多智能体方法生成多样化高质量的轨迹数据等。