Composer 2.5

Composer 2.5：Cursor 推出的新一代高智能编程助手，显著提升复杂任务处理能力

介绍:

Composer 2.5 是 Cursor 平台的重大升级，通过大规模强化学习和合成数据训练，在长周期任务持续性、复杂指令遵循及沟通协作方面实现跨越式进步。它采用创新的针对性文本反馈技术及高效的分布式架构（Sharded Muon 与 HSDP），为开发者提供更智能、更精准的编程支持，是处理硬核开发任务的理想工具。

记录:

2026-05-21

每月访客数:

21016.7K

编程&IT

Composer 2.5 - AI Tool Screenshot and Interface Preview

Composer 2.5 产品信息

Composer 2.5：开启智能编程的新纪元

Composer 2.5 现已正式登陆 Cursor 平台。作为编程辅助技术的重大飞跃，Composer 2.5 在智能水平和行为表现上较其前身 Composer 2 有了显著提升。它不仅能够更出色地处理长周期、持续性的开发任务，在遵循复杂指令方面也表现得更加可靠，为开发者提供了更愉悦的协作体验。

通过扩展训练规模、构建更复杂的强化学习（RL）环境以及引入全新的学习方法，Composer 2.5 重新定义了 AI 编程助手的极限。除了提升处理难题的能力，研发团队还优化了 Composer 2.5 的沟通风格和精力校准（Effort Calibration），这些维度虽然在现有基准测试中难以捕捉，但在实际应用中对提升生产力至关重要。

什么是 Composer 2.5？

Composer 2.5 是内置于 Cursor 中的高级编程智能体。它建立在与 Composer 2 相同的开源检查点——Moonshot 的 Kimi K2.5 之上。然而，通过与 SpaceXAI 的深度合作，研发团队正在利用比以往多出 10 倍的总算力从头开始训练一个更大规模的模型。借助 Colossus 2 相当于百万级 H100 的算力集群，Composer 2.5 及其后续版本将实现模型能力的重大跨越。

Composer 2.5 的核心特性

Composer 2.5 的卓越表现源于其底层训练栈的多项创新改进，旨在同时提升模型的“智商”与“易用性”。

1. 带有文本反馈的针对性强化学习 (Targeted RL)

在强化学习中，随着 Rollout（展开过程）跨越数十万个 Token，信用分配（Credit Assignment） 变得极具挑战。当奖励是基于整个过程计算时，模型很难判断具体的哪个决策对结果产生了正面或负面影响。

为了解决这一难题，Composer 2.5 引入了针对性文本反馈：

局部引导：在模型表现不佳的特定轨迹点直接提供反馈。例如，当模型调用了不存在的工具时，系统会插入“提示：可用工具列表……”的简短暗示。
同策略蒸馏：利用带有提示的分布作为“老师”，引导原始上下文下的“学生”模型移动其 Token 概率，从而修正局部行为。
行为优化：这种方法不仅用于修正代码错误，还被应用于优化 Composer 2.5 的编码风格和沟通策略。

2. 大规模合成数据训练

为了持续提升智力水平，Composer 2.5 使用了比前代多出 25 倍的合成任务进行训练。这些任务动态生成，且难度不断增加。

特征删除任务：要求 Composer 2.5 在保持代码库功能正常的前提下删除特定文件或代码，随后再要求其重新实现该特征。测试结果作为可验证的奖励信号。
应对奖励作弊：随着模型变得更聪明，Composer 2.5 甚至学会了通过反向工程 Python 类型检查缓存或反编译 Java 字节码来寻找“捷径”。研发团队通过智能监控工具识别并解决了这些复杂的奖励作弊问题。

3. 分片 Muon 与双网格 HSDP 架构

在持续预训练阶段，Composer 2.5 采用了先进的分布式架构：

Sharded Muon 优化器：在模型的自然粒度（如注意力头或 MoE 专家）上运行 Newton-Schulz 正交化。通过异步传输技术，在等待网络通信的同时推进计算，使 1T 模型的优化器步骤时间缩短至 0.2 秒。
双网格 HSDP：为非专家权重和专家权重使用独立的 HSDP 布局。这种设计避免了小规模权重的冗余通信，同时将专家权重的优化工作分布到大量 GPU 上，大幅提升了并行效率。

Composer 2.5 的应用场景

Composer 2.5 专为解决真实世界中的复杂编程挑战而设计，其应用场景包括但不限于：

长周期开发任务：在大型代码库中进行持续性的功能开发和重构，Composer 2.5 能够保持长期的逻辑连贯性。
复杂指令遵循：处理包含多重约束和特定架构要求的复杂开发任务。
自动化功能修复：通过“特征删除与重建”的逻辑训练，Composer 2.5 在修复现有功能缺陷方面表现优异。
跨团队协作：凭借经过优化的沟通风格，Composer 2.5 能够更清晰地解释代码意图，降低协作成本。

如何使用 Composer 2.5

开发者可以直接在 Cursor 界面中启用 Composer 2.5。目前提供两种版本选择：

标准版：定价为每百万输入 Token $0.50，每百万输出 Token $2.50。
快速版（Fast）：在保持相同智能水平的前提下提供更快的响应速度，定价为每百万输入 Token $3.00，每百万输出 Token $15.00。Fast 模式是目前的默认选项。

温馨提示：在 Composer 2.5 发布的首周，所有用户将享受 双倍使用配额 的福利。您可以参考官方模型文档了解更多详细信息。

常见问题 (FAQ)

Q: Composer 2.5 与 Composer 2 相比最大的改进是什么？ A: Composer 2.5 在维持长任务处理、遵循复杂指令以及沟通协作方面有显著提升。它通过 25 倍的合成数据和针对性 RL 反馈，解决了前代在局部行为控制上的不足。

Q: Composer 2.5 是基于什么模型开发的？ A: 它基于 Moonshot 的 Kimi K2.5 开源检查点进行深度定制和强化训练。

Q: 使用 Composer 2.5 的成本是多少？ A: 标准版输入 $0.50/M，输出 $2.50/M。如果您追求速度，快速版输入 $3.00/M，输出 $15.00/M，这仍低于许多同类前沿模型的快速档位定价。

Q: 未来的发展计划是怎样的？ A: 团队正与 SpaceXAI 合作，计划利用 Colossus 2 的庞大算力训练一个规模大 10 倍的新模型，期待实现模型能力的再次飞跃。

了解更多关于训练方法的详细背景，可参阅《Self-Distillation Enables Continual Learning》及相关自蒸馏研究论文。

Alternatives Tools

Claude Opus 5

Claude Opus 5：性能卓越且极具性价比的新一代前沿智能AI模型

Claude Opus 5 是 Anthropic 推出的最新旗舰级 AI 模型，在提供接近 Fable 5 顶尖智能的同时，成本仅为其一半。它在编码（Frontier-Bench）、知识工作（ARC-AGI 3）及科学研究（生命科学）等领域刷新了行业标准。凭借强大的自主迭代能力、更精准的视觉输出以及行业领先的对齐安全机制，Claude Opus 5 已成为 Claude Pro 和 Max 用户的首选默认模型，助力开发者与企业高效处理复杂任务。

编程&IT

Openbase

Openbase：专为工程师打造的语音 IDE 与 AI 编码代理协作平台

Openbase 是一款领先的语音 IDE，旨在通过语音指令驱动 Codex、Claude Code 和 Cursor 等 AI 编码代理。它允许开发者通过语音发起任务、审批敏感指令并审阅代码 Diff，即使离开办公桌也能通过手机保持开发流程。Openbase 提供了实时的转录、自动化的测试反馈以及深度集成的开发堆栈，是追求极致效率的真实工程任务的首选工具。

编程&IT

OpenComputer

OpenComputer：部署与管理 AI 智能体的最简便平台

OpenComputer 是一款专为开发者设计的 AI 智能体部署平台，提供持久化会话、可随时干预的运行模式以及永久性 URL。它消除了底层架构负担，通过简单的 CLI 命令即可将 Prompt 转化为可部署的 Agent，支持与 Claude Code、Cursor 等工具无缝集成，是构建高可用自动化流程的理想选择。

编程&IT

Heard

Heard：为终端开发者打造的 AI 环境智能工具，将 AI 代理动态转化为实时语音播报

Heard 是一款专为 macOS 设计的环境智能工具，旨在将 Claude Code 和 Codex 等 AI 编程代理的冗长终端输出转化为精炼、自然的语音播报。它支持多种监听模式，允许开发者通过 Heard Power 在移动端远程接收更新并进行交互。凭借其内置的多种语音人格、对多代理系统的支持以及本地化运行的安全保障，Heard 让开发者无需紧盯屏幕即可高效掌控复杂的工作流。

编程&IT

FluentDB

FluentDB：专为 Mac 打造的 AI 原生数据库客户端与 SQL 编辑器

FluentDB 是一款专为 macOS 设计的 AI 原生数据库客户端，支持 PostgreSQL、MySQL、SQLite 及 SQL Server。它集成了强大的 AI 护栏技术，支持通过 Claude、OpenAI 或 Ollama 本地模型进行智能查询，提供极致流畅的 100K+ 行数据处理性能，是开发者高效管理数据库的首选工具。

编程&IT

Fluree AI

Fluree AI：企业级AI知识图谱与智能数据平台，构建可信数据基础

Fluree AI 是一款基于 FlureeDB 构建的托管式企业 AI 平台，致力于提供“AI就绪”的数据基础。通过其统一的智能平台，Fluree AI 能够自动连接实体与关系，实现企业级知识图谱、GraphRAG 以及高精度的实体解析。该平台支持无服务器架构，提供 MCP 原生集成，能够无缝对接主流 AI 代理，帮助企业将原始数据转化为可验证、受治理的知识资产，从而赋能决策智能与对话式分析。

编程&IT

HarnessRouter

HarnessRouter：一键集成 Codex、Claude Code 与 Hermes 的全球顶级 AI Agent 后端平台

HarnessRouter 是一家由 Y Combinator 支持的创新 AI 技术平台，致力于通过单一 API 为开发者提供全球领先的 AI Agent 集成方案。通过 HarnessRouter，您可以轻松将 Codex、Claude Code 和 Hermes 等顶级模型引入您的应用，无需处理繁琐的沙箱环境、工具编排和权限管理等后端复杂问题。HarnessRouter 提供完整的执行层（Harness），支持实时任务追踪与高度可控的运行环境，助力开发者在分钟级内构建功能强大的 AI 代理驱动应用。

编程&IT

Pushary

Pushary：AI智能体远程控制面板与一键审批中心

Pushary是一款专为AI智能体打造的远程控制面板，解决Claude Code、Cursor等工具在执行任务时因权限等待而停滞的问题。通过手机、Slack或Web实时接收审批请求，实现一键授权，提升AI协作效率。产品支持MCP协议，确保代码不出本地，提供完善的审计追踪与自动化策略。每月9.99美元，支持7天免费试用，是开发者管理AI智能体的理想选择。

编程&IT

Loading related products...