
美团发布LongCat-2.0:首个在五万卡国产算力集群训练的万亿参数大模型
美团技术团队正式发布LongCat-2.0模型。该模型是业界首个在五万卡国产算力集群上完成全流程训练与推理的万亿参数模型,总参数量达1.6T。LongCat-2.0原生支持1M超长上下文,专为Agentic Coding任务设计,旨在提升代码理解、生成与执行的效率与稳定性。
核心要点
- 国产算力突破:业界首个在五万卡国产算力集群上完成全流程训练与推理的模型。
- 万亿级参数规模:总参数量达1.6T,平均激活约48B,动态范围在33B至56B之间。
- 超长上下文支持:原生支持1M(一百万)token超长上下文,满足复杂任务需求。
- 聚焦编程智能:针对Agentic Coding任务优化,涵盖代码理解、生成与执行的全流程。
详细分析
国产算力集群的大规模应用实践
LongCat-2.0的发布标志着国产算力在超大规模模型训练领域取得了重要进展。该模型在拥有五万张卡的国产算力集群上完成了从零开始的预训练及后续推理任务。这一成果不仅验证了国产硬件在支撑万亿级参数模型全流程任务中的可靠性,也展示了在大规模集群管理与算力调度方面的技术成熟度。
极致的参数架构与长文本处理能力
在架构设计上,LongCat-2.0拥有1.6T的总参数量,通过精细的动态激活机制(平均激活48B),在保证模型容量的同时优化了计算效率。此外,模型原生支持1M超长上下文,使其能够处理极其复杂的长代码库和深度文档分析,为处理大规模软件工程任务提供了必要的技术基础。
赋能Agentic Coding核心场景
LongCat-2.0的设计初衷是服务于真实的Agentic Coding任务。通过优化架构,模型在代码理解、代码生成以及代码执行三个核心环节表现出更高的效率与稳定性。这种针对特定垂直领域的深度优化,旨在解决复杂编程环境中的自动化难题,提升AI在软件开发全生命周期中的参与度。
行业影响
LongCat-2.0的推出展示了美团在AI基础设施与大模型算法上的领先地位,特别是验证了国产算力集群承载万亿级模型的能力。其对1M超长上下文的支持和对Agentic Coding的专注,将推动AI在软件开发自动化领域的应用边界,为国产大模型的技术演进和生态建设提供了重要的实战参考。
常见问题
LongCat-2.0的参数规模和激活机制是怎样的?
LongCat-2.0的总参数量为1.6T,属于万亿级参数模型。它采用了动态激活机制,平均激活参数约为48B,动态范围在33B至56B之间,实现了性能与效率的平衡。
该模型在算力支持上有何特殊之处?
它是业界首个在五万卡规模的国产算力集群上,完成从零预训练到推理全流程的万亿参数模型,证明了国产算力在大规模AI训练中的实力。
LongCat-2.0主要解决什么问题?
该模型核心目标是优化Agentic Coding任务,通过原生支持1M超长上下文,提升在真实编程场景下代码理解、生成与执行的稳定性和效率。


