Kimi K2.7 Code
Moonshot AI Kimi-K2.7-Code:深度优化的 1T 参数编程专用智能 Agent 大模型
Kimi-K2.7-Code 是由 Moonshot AI 推出的一款专注于编程的智能代理模型。该模型基于 Kimi K2.6 构建,在处理真实世界的长周期编程任务和复杂软件工程工作流中表现出色。它采用先进的 MoE 架构,拥有 1T 总参数及 32B 激活参数,支持 256K 超长上下文,并原生支持多模态输入,是开发者提升编程效率、构建自动化开发流程的理想工具。
2026-06-15
27366.8K
Kimi K2.7 Code 产品信息
Moonshot AI Kimi-K2.7-Code:开启高效编程新纪元的智能 Agent 大模型
在人工智能驱动开发的浪潮中,Moonshot AI 推出的 Kimi-K2.7-Code 标志着编程领域智能代理(Agentic Model)的一次重大进化。作为一款专门为编程任务深度优化的模型,Kimi-K2.7-Code 不仅继承了前代模型的优秀基因,更在复杂软件工程工作流的端到端任务完成能力上取得了突破性进展。
What's Kimi-K2.7-Code
Kimi-K2.7-Code 是 Moonshot AI 在 Kimi K2.6 基础上构建的编程增强型智能 Agent 模型。它旨在解决真实世界中那些需要长周期、多步骤思考的编程难题。该模型最显著的进步在于其对软件工程全流程的掌控能力,以及在执行效率上的优化。
与 Kimi K2.6 相比,Kimi-K2.7-Code 在确保性能提升的同时,成功将推理时的“思考 Token”(Thinking Tokens)使用量降低了约 30%。这意味着模型在处理相同难度的任务时,能够以更低的成本和更高的效率产出结果。同时,它依然保持了强大的多模态理解能力,能够同时处理文本、图像甚至是视频输入,为多维度的编程辅助提供了可能。
模型核心参数摘要
以下是 Kimi-K2.7-Code 的主要技术规格:
- 架构类型:混合专家模型 (Mixture-of-Experts, MoE)
- 总参数量:1T (1 万亿)
- 激活参数量:32B
- 层数:61 层 (含密集层)
- 注意力机制:MLA (Multi-head Latent Attention)
- 激活函数:SwiGLU
- 上下文长度:256K
- 专家系统:共 384 个专家,每个 Token 激活 8 个专家,含 1 个共享专家
- 词表大小:160K
- 视觉编码器:MoonViT (400M 参数)
Features
1. 卓越的编程与 Agent 性能
Kimi-K2.7-Code 在多项权威榜单中表现优异。在 Kimi Code Bench v2 测试中,其得分从前代的 50.9 大幅提升至 62.0;在 MCP Mark Verified 等 Agent 评估中更是表现出超越同类产品的潜力,展现了其作为编程代理的极高上限。
2. 高效的推理思维
通过算法优化,Kimi-K2.7-Code 强制开启了“思考模式”(Thinking Mode),并引入了 Preserve Thinking 特性。这使得模型在多轮对话中能够保留完整的推理逻辑,确保在处理复杂逻辑转换时不丢掉关键思路。
3. 多模态理解能力
搭载 MoonViT 视觉编码器,Kimi-K2.7-Code 支持 Image-Text-to-Text 任务。开发者可以直接上传 UI 截图、架构图甚至是操作视频,让模型根据视觉信息编写或修复代码。
4. 原生 INT4 量化支持
为了优化部署成本,Kimi-K2.7-Code 采用了与 Kimi-K2-Thinking 相同的原生 INT4 量化技术,在保证模型精度的同时大幅降低了显存占用。
Use Case
- 长周期软件工程任务:处理跨多个文件的代码重构、功能实现及系统迁移。
- 自动化 Debug 与测试:通过分析复杂的报错日志和视觉 UI 异常,自动定位问题并生成修复方案。
- 多模态编程辅助:基于产品设计原型图(图像)直接生成前端界面代码,或分析视频中的操作流程进行文档化。
- 智能编程助手:作为企业级编程 Agent 框架(如 Kimi Code CLI)的核心引擎,提供端到端的自动化开发支持。
How to Use
环境要求
- Transformers 版本:需满足
>=4.57.1, <5.0.0。 - 推荐推理引擎:vLLM, SGLang, 或 KTransformers。
使用 Transformers 库调用
from transformers import pipeline
# 使用 pipeline 进行快速调用
pipe = pipeline("image-text-to-text", model="moonshotai/Kimi-K2.7-Code", trust_remote_code=True)
messages = [
{
"role": "user",
"content": [
{"type": "image", "url": "https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/p-blog/candy.JPG"},
{"type": "text", "text": "What animal is on the candy?"}
]
},
]
pipe(text=messages)
使用 vLLM 部署服务端
- 安装 vLLM:
pip install vllm - 启动服务:
vllm serve "moonshotai/Kimi-K2.7-Code" - API 调用示例 (Curl):
curl -X POST "http://localhost:8000/v1/chat/completions" \ -H "Content-Type: application/json" \ --data '{ "model": "moonshotai/Kimi-K2.7-Code", "messages": [ { "role": "user", "content": [{"type": "text", "text": "Describe this image in one sentence."}] } ] }'
官方 API 调用注意事项
- Thinking Mode:Kimi-K2.7-Code 强制开启
thinking和preserve_thinking为True。 - 参数建议:建议
temperature设置为 1.0,top_p设置为 0.95。 - 不支持模式:目前不支持 Instant 模式。
FAQ
Q: Kimi-K2.7-Code 的授权协议是什么?
A: 该模型的代码仓库和权重均采用 Modified MIT License(修改版 MIT 协议)发布。
Q: 如何处理多轮对话中的思考逻辑?
A: 模型强制使用 Preserve Thinking 模式,这会自动在多轮交互中保留推理内容。在调用 API 时,可以通过返回的
reasoning_content字段获取模型的中间思考过程。
Q: 支持视频输入吗?
A: 是的,Kimi-K2.7-Code 支持视频输入,但目前该功能仅在 Moonshot AI 官方 API 中作为实验性功能提供支持。
Q: 它和 GPT-4 或 Claude 相比性能如何?
A: 根据测试数据,在 MCP Atlas 和 MCP Mark Verified 等 Agent 相关榜单上,Kimi-K2.7-Code 的表现非常强劲,部分指标接近或超越了同级别的顶尖模型。
联系方式:如有任何疑问,请联系官方支持团队:
[email protected]。








