美团LongCat-2.0发布：五万卡国产算力训练的1.6T万亿模型

美团技术团队正式发布LongCat-2.0模型。该模型是业界首个在五万卡国产算力集群上完成全流程训练与推理的万亿参数模型，总参数量达1.6T。LongCat-2.0原生支持1M超长上下文，专为Agentic Coding任务设计，旨在提升代码理解、生成与执行的效率与稳定性。

核心要点

LongCat-2.0的发布标志着国产算力在超大规模模型训练领域取得了重要进展。该模型在拥有五万张卡的国产算力集群上完成了从零开始的预训练及后续推理任务。这一成果不仅验证了国产硬件在支撑万亿级参数模型全流程任务中的可靠性，也展示了在大规模集群管理与算力调度方面的技术成熟度。

在架构设计上，LongCat-2.0拥有1.6T的总参数量，通过精细的动态激活机制（平均激活48B），在保证模型容量的同时优化了计算效率。此外，模型原生支持1M超长上下文，使其能够处理极其复杂的长代码库和深度文档分析，为处理大规模软件工程任务提供了必要的技术基础。

LongCat-2.0的设计初衷是服务于真实的Agentic Coding任务。通过优化架构，模型在代码理解、代码生成以及代码执行三个核心环节表现出更高的效率与稳定性。这种针对特定垂直领域的深度优化，旨在解决复杂编程环境中的自动化难题，提升AI在软件开发全生命周期中的参与度。

LongCat-2.0的推出展示了美团在AI基础设施与大模型算法上的领先地位，特别是验证了国产算力集群承载万亿级模型的能力。其对1M超长上下文的支持和对Agentic Coding的专注，将推动AI在软件开发自动化领域的应用边界，为国产大模型的技术演进和生态建设提供了重要的实战参考。

LongCat-2.0的总参数量为1.6T，属于万亿级参数模型。它采用了动态激活机制，平均激活参数约为48B，动态范围在33B至56B之间，实现了性能与效率的平衡。

它是业界首个在五万卡规模的国产算力集群上，完成从零预训练到推理全流程的万亿参数模型，证明了国产算力在大规模AI训练中的实力。

该模型核心目标是优化Agentic Coding任务，通过原生支持1M超长上下文，提升在真实编程场景下代码理解、生成与执行的稳定性和效率。