Kimi K2.7 Code

Moonshot AI Kimi-K2.7-Code：深度优化的 1T 参数编程专用智能 Agent 大模型

介绍:

Kimi-K2.7-Code 是由 Moonshot AI 推出的一款专注于编程的智能代理模型。该模型基于 Kimi K2.6 构建，在处理真实世界的长周期编程任务和复杂软件工程工作流中表现出色。它采用先进的 MoE 架构，拥有 1T 总参数及 32B 激活参数，支持 256K 超长上下文，并原生支持多模态输入，是开发者提升编程效率、构建自动化开发流程的理想工具。

记录:

2026-06-15

每月访客数:

27366.8K

编程&IT

Kimi K2.7 Code - AI Tool Screenshot and Interface Preview

Kimi K2.7 Code 产品信息

Moonshot AI Kimi-K2.7-Code：开启高效编程新纪元的智能 Agent 大模型

在人工智能驱动开发的浪潮中，Moonshot AI 推出的 Kimi-K2.7-Code 标志着编程领域智能代理（Agentic Model）的一次重大进化。作为一款专门为编程任务深度优化的模型，Kimi-K2.7-Code 不仅继承了前代模型的优秀基因，更在复杂软件工程工作流的端到端任务完成能力上取得了突破性进展。

What's Kimi-K2.7-Code

Kimi-K2.7-Code 是 Moonshot AI 在 Kimi K2.6 基础上构建的编程增强型智能 Agent 模型。它旨在解决真实世界中那些需要长周期、多步骤思考的编程难题。该模型最显著的进步在于其对软件工程全流程的掌控能力，以及在执行效率上的优化。

与 Kimi K2.6 相比，Kimi-K2.7-Code 在确保性能提升的同时，成功将推理时的“思考 Token”（Thinking Tokens）使用量降低了约 30%。这意味着模型在处理相同难度的任务时，能够以更低的成本和更高的效率产出结果。同时，它依然保持了强大的多模态理解能力，能够同时处理文本、图像甚至是视频输入，为多维度的编程辅助提供了可能。

模型核心参数摘要

以下是 Kimi-K2.7-Code 的主要技术规格：

架构类型：混合专家模型 (Mixture-of-Experts, MoE)
总参数量：1T (1 万亿)
激活参数量：32B
层数：61 层 (含密集层)
注意力机制：MLA (Multi-head Latent Attention)
激活函数：SwiGLU
上下文长度：256K
专家系统：共 384 个专家，每个 Token 激活 8 个专家，含 1 个共享专家
词表大小：160K
视觉编码器：MoonViT (400M 参数)

Features

1. 卓越的编程与 Agent 性能

Kimi-K2.7-Code 在多项权威榜单中表现优异。在 Kimi Code Bench v2 测试中，其得分从前代的 50.9 大幅提升至 62.0；在 MCP Mark Verified 等 Agent 评估中更是表现出超越同类产品的潜力，展现了其作为编程代理的极高上限。

2. 高效的推理思维

通过算法优化，Kimi-K2.7-Code 强制开启了“思考模式”（Thinking Mode），并引入了 Preserve Thinking 特性。这使得模型在多轮对话中能够保留完整的推理逻辑，确保在处理复杂逻辑转换时不丢掉关键思路。

3. 多模态理解能力

搭载 MoonViT 视觉编码器，Kimi-K2.7-Code 支持 Image-Text-to-Text 任务。开发者可以直接上传 UI 截图、架构图甚至是操作视频，让模型根据视觉信息编写或修复代码。

4. 原生 INT4 量化支持

为了优化部署成本，Kimi-K2.7-Code 采用了与 Kimi-K2-Thinking 相同的原生 INT4 量化技术，在保证模型精度的同时大幅降低了显存占用。

Use Case

长周期软件工程任务：处理跨多个文件的代码重构、功能实现及系统迁移。
自动化 Debug 与测试：通过分析复杂的报错日志和视觉 UI 异常，自动定位问题并生成修复方案。
多模态编程辅助：基于产品设计原型图（图像）直接生成前端界面代码，或分析视频中的操作流程进行文档化。
智能编程助手：作为企业级编程 Agent 框架（如 Kimi Code CLI）的核心引擎，提供端到端的自动化开发支持。

How to Use

环境要求

Transformers 版本：需满足 >=4.57.1, <5.0.0。
推荐推理引擎：vLLM, SGLang, 或 KTransformers。

使用 Transformers 库调用

from transformers import pipeline

# 使用 pipeline 进行快速调用
pipe = pipeline("image-text-to-text", model="moonshotai/Kimi-K2.7-Code", trust_remote_code=True)

messages = [
    {
        "role": "user",
        "content": [
            {"type": "image", "url": "https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/p-blog/candy.JPG"},
            {"type": "text", "text": "What animal is on the candy?"}
        ]
    },
]
pipe(text=messages)

使用 vLLM 部署服务端

安装 vLLM： pip install vllm
启动服务： vllm serve "moonshotai/Kimi-K2.7-Code"

API 调用示例 (Curl)：

curl -X POST "http://localhost:8000/v1/chat/completions" \
    -H "Content-Type: application/json" \
    --data '{
        "model": "moonshotai/Kimi-K2.7-Code",
        "messages": [
            {
                "role": "user",
                "content": [{"type": "text", "text": "Describe this image in one sentence."}]
            }
        ]
    }'

官方 API 调用注意事项

Thinking Mode：Kimi-K2.7-Code 强制开启 thinking 和 preserve_thinking 为 True。
参数建议：建议 temperature 设置为 1.0，top_p 设置为 0.95。
不支持模式：目前不支持 Instant 模式。

FAQ

Q: Kimi-K2.7-Code 的授权协议是什么？

A: 该模型的代码仓库和权重均采用 Modified MIT License（修改版 MIT 协议）发布。

Q: 如何处理多轮对话中的思考逻辑？

A: 模型强制使用 Preserve Thinking 模式，这会自动在多轮交互中保留推理内容。在调用 API 时，可以通过返回的 reasoning_content 字段获取模型的中间思考过程。

Q: 支持视频输入吗？

A: 是的，Kimi-K2.7-Code 支持视频输入，但目前该功能仅在 Moonshot AI 官方 API 中作为实验性功能提供支持。

Q: 它和 GPT-4 或 Claude 相比性能如何？

A: 根据测试数据，在 MCP Atlas 和 MCP Mark Verified 等 Agent 相关榜单上，Kimi-K2.7-Code 的表现非常强劲，部分指标接近或超越了同级别的顶尖模型。

联系方式：如有任何疑问，请联系官方支持团队：[email protected]。

Alternatives Tools

Fluree AI

Fluree AI：企业级AI知识图谱与智能数据平台，构建可信数据基础

Fluree AI 是一款基于 FlureeDB 构建的托管式企业 AI 平台，致力于提供“AI就绪”的数据基础。通过其统一的智能平台，Fluree AI 能够自动连接实体与关系，实现企业级知识图谱、GraphRAG 以及高精度的实体解析。该平台支持无服务器架构，提供 MCP 原生集成，能够无缝对接主流 AI 代理，帮助企业将原始数据转化为可验证、受治理的知识资产，从而赋能决策智能与对话式分析。

编程&IT

HarnessRouter

HarnessRouter：一键集成 Codex、Claude Code 与 Hermes 的全球顶级 AI Agent 后端平台

HarnessRouter 是一家由 Y Combinator 支持的创新 AI 技术平台，致力于通过单一 API 为开发者提供全球领先的 AI Agent 集成方案。通过 HarnessRouter，您可以轻松将 Codex、Claude Code 和 Hermes 等顶级模型引入您的应用，无需处理繁琐的沙箱环境、工具编排和权限管理等后端复杂问题。HarnessRouter 提供完整的执行层（Harness），支持实时任务追踪与高度可控的运行环境，助力开发者在分钟级内构建功能强大的 AI 代理驱动应用。

编程&IT

Pushary

Pushary：AI智能体远程控制面板与一键审批中心

Pushary是一款专为AI智能体打造的远程控制面板，解决Claude Code、Cursor等工具在执行任务时因权限等待而停滞的问题。通过手机、Slack或Web实时接收审批请求，实现一键授权，提升AI协作效率。产品支持MCP协议，确保代码不出本地，提供完善的审计追踪与自动化策略。每月9.99美元，支持7天免费试用，是开发者管理AI智能体的理想选择。

编程&IT

AdaptlyPost

AdaptlyPost：全方位社交媒体自动化管理与 AI 内容创作调度平台

AdaptlyPost 是一款高效的社交媒体调度与自动化工具，旨在帮助创作者、开发者及企业简化多平台内容管理。通过统一的仪表盘，用户可以一键发布内容至 Instagram、TikTok、YouTube、X 等主流平台。该平台集成 AI 图像生成器与 AI 脚本助手，支持自动适配平台格式、视觉化内容日历及 API 接入。无论是提升发帖频率还是优化内容互动，AdaptlyPost 都能助您节省时间并实现业务增长。

编程&IT

AskCodi

AskCodi：由 AI 代理驱动的一站式智能工程团队与代码协作平台

AskCodi 是一款专为开发者设计的 AI 工程指挥中心。它能将单一对话转化为完整的项目地图，自动创建并分配任务，由 AI 专家级代理在独立的 Git 工作树中并行执行。AskCodi 支持 100% 本地运行以保障代码隐私，并允许用户接入现有的 Claude 或 OpenAI 订阅，无需额外账单。拥有 50 多种模型选择及 OpenAI 兼容 API，AskCodi 旨在让单人开发者也能拥有一个高效的工程团队，助力快速交付高质量代码。

编程&IT

box

box by ASCII - 最具性价比且功能强大的 AI 智能体专用 Ubuntu 云端沙箱

box 是由 ASCII 打造的专为 AI 智能体设计的持久化 Ubuntu 虚拟机沙箱。它支持 SSH/SCP、Docker、60fps 虚拟桌面及磁盘级快照克隆。提供 4 vCPU / 8 GB 高性能配置，按秒计费，月费低至 $20，是目前市场上最实惠的 agent 沙箱方案，完美适配 Claude Code 与 Codex 等智能体。

编程&IT

Ofox

GPT-5.6 正式发布：全能 AI 模型聚合平台与开发者 API 详解

GPT-5.6 正式上线，OfoxAI 提供一站式 AI 模型接入服务。支持 100 多种顶级模型，包括 OpenAI、Anthropic 及 Gemini 等，具备 99.9% 高可用性和 300ms 极低延迟。现正进行七月特惠，全线 GPT 产品 8 折优惠。无论是 Vibe Coding、图像生成还是视频创作，OfoxAI 都能为开发者提供强有力的技术支持。

编程&IT

Kastra

Kastra：专业的 AI 运行时授权与安全治理平台

Kastra 是领先的 AI 系统运行时授权平台，致力于在 AI 代理执行操作前进行实时策略校验。它能在 1 毫秒内对每一项 Prompt、工具调用、Shell 命令和 API 请求做出“允许”或“拒绝”的决策，填补了 AI 基础设施中安全治理的空白。Kastra 支持 Kastra Edge 桌面治理、Kastra Recon 历史扫描及统一控制平面，助力企业在满足 SOC 2、HIPAA 等严苛合规要求的同时，实现 AI 代理的自主与受控执行。

编程&IT

Loading related products...