月之暗面開源 Kimi K2.7-Code:推理 token 省 30%,主治模型「想太多」
中國 AI 公司月之暗面(Moonshot AI)6 月 12 日發布 Kimi K2.7-Code,定位是 K2.6 的編碼特化後繼者,採用修改版 MIT 授權開源,權重直接上架 Hugging Face。架構是 1 兆總參數的混合專家(MoE)模型,啟用參數 320 億,可透過相容 OpenAI 與 Anthropic SDK 的 Moonshot API 以及終端編碼代理 Kimi Code 使用。
這次的主打不是分數而是效率:官方宣稱推理 token 用量比前代減少 30%,針對的是研究圈說的「過度思考」(overthinking)問題——模型在編碼任務上花太多 token 自我辯論,算力燒掉、延遲變高、API 帳單跟著膨脹。基準成績同步提升:Kimi Code Bench v2 進步 21.8%、Program Bench 進步 11.0%、MLS Bench Lite 跳升 31.5%。
K2.7-Code 也登上 Hacker News 熱榜,討論聚焦在開源編碼模型與封閉模型的差距收斂速度。在 Fable 5 評價兩極(見本期另兩條)的這一週,中國實驗室用「便宜、開源、夠用」的組合切入市場,對成本敏感的團隊吸引力很實際:代理工作流動輒一次跑幾百個步驟,同樣的任務少燒三成 token,乘上整年的呼叫量,省下來的是看得見的真金白銀,也是中國模型搶占海外開發者市場最有效的敲門磚。
歸剛點評|編碼模型的競爭已經從「誰最聰明」轉向「誰每塊錢最聰明」。token 效率聽起來無聊,但代理動輒跑幾百步,30% 的差距會被乘數放大。開源加上雙 SDK 相容,擺明就是要讓你無痛換掉現在用的那家。