编程卷王 Kimi K2.7 Code 上线!一手实测,夯爆了还是拉完了?

大家好,我是小林。

上周 Anthropic 发布了 Claude Fable 5 模型,我第一时间也把自己的 Claude Code 切换成 Fable 5 来干活。

比如之前有读者跟我说,他上班刷我大模型面试题网站的时候,感觉有网站tag有面试题,怕同事知道他要准备面试跑路了,说如果能有个沉浸阅读模式就好了。

以前,这个前端的实现我不会啊

现在,对着 Cladue Code 口喷 xxxx,功能就实现好了。

现在网站(xiaolinnote.com)现在有沉浸阅读按钮了,点击之后会直接隐藏顶部和左侧的目录了,这样上班刷我网站的时候,同事只会觉得你在看技术博客,而不是面试题网站了。

不得不说,Fable 5 确实好用啊,一句话就完成了我的需求。

然后我就想接着继续把之前 MewCode Agent 项目一个问题解决掉,有同学吐槽 Java 版本的MewCode Agent 项目的 CLI 页面体验不是很好。

这个其实是 Java 的 TUI 库不太成熟导致的问题,但要自己重新实现 TUI 库太费力气了。

所以我们就想在 MewCode Agent 项目增加 remote 功能,直接在网页上跟 Coding Agent 交互,这样体验肯定是比在终端好很多的。

说干就干,但是当我干的时候,好巧不巧看到 Anthropic 就针对一切外国用户把 Fable 5 模型下架了...

我瞬间气笑了好嘛,这才刚上头几天,热乎劲儿还没过呢,那头说断就断,这谁顶得住啊。

我越来越明显地感觉到,以后用 Claude 模型越来越难了,闭源模型这点真没办法,说没就没,你还拿它没脾气。

我最近看了一下国产模型这边的消息,国内AI模型厂商也在没有闲着,看到有好几家厂商在这个月推出了新模型,这迭代速度越来越快了。

这几天刚好看到了 Kimi 发了 K2.7 Code 模型 ,官方说是迄今最强的 Coding 模型,发布即开源

所以,我就想切到 Kimi 来干这个,原因其实很简单:前端能力出众, Kimi 出的前端顺眼,能省不少调样式的功夫。

冲着这点,我没多想,我就接着用 K2.7 Code 模型在 MewCode Agent 项目增加了 remote 功能。

这个让 Kimi 先读代码再出方案:

markdown 复制代码
请阅读这个 Mewcode agent 项目,设计并实现 remote 功能。
1. 本地 TUI 仍然能用。
2. 新增 remote 模式,能在远程界面看任务状态和交互。
3. 别大改核心逻辑。
4. 先给计划,我确认后再写代码。

出来的结果计划思路对,改动范围也压得住,没有要掀翻重写的意思。确认后让它写。

第一轮对话通了,remote 这条通道算是起来了。界面简洁清新,但该有的没少,session、token 计数、输入框都在。

说实话,我对 Kimi 一直挺有好感。商业化做得稳,不会动不动就背刺老用户,而且在国内的编程模型里,它一直稳稳站在第一梯队,尤其前端这块,做得是真不错。

这 K2.7 Code 新模型一出来,就有不少读者催我来测评看看效果。

我们先来看看官方是怎么介绍的 K2.7 Code 模型的?

Kimi K2.7 Code 相比 K2.6,大幅提升了长上下文编程场景的指令遵循能力、长程编程任务的性能表现,以及改善了在长程任务中的过度思考倾向,平均 token 消耗减少 30%。

Coding 和 Agentic 能力的跑分图我也贴一张:

有一说一,Coding 能力这一块,确实还追不上 Opus 4.8 和 GPT-5.5 拉满推理预算那档,但 Agentic 能力有明显赶上的趋势。

注意看,对比自家上一代 K2.6 模型,提升是实打实的,Coding 那条尤其明显,直接提升了 21.8%,推理 token 消耗还降了三成左右。

废话不多说,我们直接上手 K2.7 Code 模型来看看!

Kimi Code 接入 K2.7 Code 模型

想最快开始就走 Kimi Code CLI,它是 Kimi 自己的 coding agent,装起来很直观。

arduino 复制代码
curl -fsSL https://code.kimi.com/kimi-code/install.sh | bash

装好进项目目录,敲 kimi 启动,第一次用 /login 登录就行。

默认上下文 256K,图片和视频都能喂。图片支持 png、jpeg、webp、gif,视频支持 mp4、mov、avi、webm。多嘴一句,Coding Agent 很容易自动重试,一次任务能烧不少 token,跑之前先把每日消费上限和余额提醒配好,省心。

一手实测

1)做一个世界杯预测网页

对了,最近不是世界杯了嘛,所以我就做一个世界杯冠军预测网页,拷打一下 kimi K2.7 Code 的前端和数据收集的能力。

这个需求我特意要求它别直接甩结论,先收集数据再一轮一轮往下推:

markdown 复制代码
请做一个世界杯冠军预测网页。
1. 先摆出目前小组赛打完的结果,作为预测起点。
2. 收集各队和球员的历史数据,加上本届已踢过的成绩。
3. 从这轮一轮一轮往后预测,别直接甩个冠军给我。
4. 每支球队的预测要有关键指标和关键球员支撑。
5. 页面要有可视化图表,能看到夺冠概率。
6. 最后给我一个能本地跑的前端项目。

出来的效果:

进来后,前端做的确实可以,质感和美感还有氛围有世界杯的味道,不愧是kimi,前端这一块确实很能打。

我们直接点击开始数据收集和预测试试

点击了开始收集和预测后,会去分析过往的比赛数据,然后预测每轮比赛的赛果,最后还会直接跳到预测结果那一块,体验感和炫酷感都拉满了

对于每个球队,还有模型分析,比如一些关键指标和关键球员加以支撑论据

当然你如果不相信大模型的分析,这里也会有热门球队的数据和战绩过来,来提供给用户去决策

要挑毛病的话,可能就是预测的可解释性还差点意思,结果给你了,中间怎么权衡的露得不够。

至于kimi 预测的结果准不准,就看后续的世界杯进程啦。

2)看球赛视频,找进球做高光剪辑

Kimi 这次支持视频输入,这个跟 coding 凑一起就有意思了。真实干活我们经常不只丢文字,可能甩一段录屏、一段比赛视频过去。

我准备了一段六分钟的球赛视频,让它找出进球瞬间,按时间点出高光剪辑方案,最好直接给能跑的脚本。

markdown 复制代码
我会给你一段球赛视频。
1. 找出所有疑似进球瞬间,输出起止时间。
2. 每个片段写一句说明。
3. 生成 ffmpeg 脚本把片段剪出来。
4. 给一个合并成高光视频的命令。

跑完翻目录,有点惊喜。

一个 goal_highlights 文件夹,六个进球片段从 usa_goal_1 排到 par_goal_1,我们可以翻两个看看。

精彩进球时刻

最后从识别到剪辑到合并,整条链路它自己跑通了,我一步手没插。

我感觉还缺了点什么,然后让它照画面配一段央视那种解说词,还别说,kimi 多模态的能力确实厉害。

3)让它啃完 SpaceX 招股书,出 PPT 和网页

最近不是马斯克的SpaceX 上市嘛,我找了 SpaceX 招股书来试试让Kimi去分析。

几百页,SEC 公文那种排版,密密麻麻的法律条文,我自己点开第一反应都是这玩意儿也太长了,真要从里面捞信息跟大海捞针一样。

于是我先把我自己最想知道的几个问题列出来,让它带着问题去读:

  • SpaceX 到底有哪些业务?
  • 每块业务赚不赚钱?
  • 往后盈利空间还有多大?
  • 有哪些风险是普通投资者得知道的?
markdown 复制代码
请分析这份 SpaceX 招股书,回答我这几个问题:
1. 有哪些业务,每块盈利情况如何,未来空间多大?
2. 有哪些风险因素普通投资者必须关注?
​
输出两部分:
1. 一份做好的 PPT 文件,要 .pptx,别只给大纲,面向普通读者,8 到 10 页。
2. 一个能本地跑的网页,把业务、数据、风险、亮点可视化。
​
要求:用自己的话归纳,财务做成图表,风险一条别省。

PPT就是标准的研报风格,看起来还是很专业的

下面来看看做的网页

网页做的是真可以,星空感十足,有点SpaceX的那种氛围了

像我们关心的问题,业务部分,SpaceX的业务都详细进行了介绍,可以看到有三个大模块,还有每块业务的盈利如何,以及对于总营收的占比

包括这些板块的营收趋势、结构、运营都有,可以说是非常适合分析了

对于每块业务赚不赚钱,数据都直观展示出来

还有对于未来的盈利空间和需要钉紧的变量提醒

当然还有我们投资者最关心的风险这里,原文那么多条很难去看,这里帮我们都聚类好了,还标上了优先级

当然你要是想自己去一条条对照和交叉验证,也可以划到下面,去看,事实源也都保存在这里

不得不说,K2.7 Code 前端能力确实非常能打,审美都非常在线,没有那种蓝紫色风格的AI味了。

最后

K2.7 Code 用下来,我的感受是:它能干的事,比我一开始预期的多不少,但真要论精细度,还无法和海外最顶尖的模型媲美。

先把几个让我有感觉的测试摆出来。

世界杯那个网页,一次就跑通,没让我来回调。最让我意外的是「视频找进球」那个活,我本来只是随手一试,结果它自己写脚本、自己把片子合出来,我全程一步都没插手。看着进度条往前走的时候,说实话有点恍惚,这已经不太像在用工具了,更像在带一个会自己干活的实习生。

SpaceX 那份招股书,几百页它是真读完了,财务、风险、亮点一个没漏,最后页面还做得挺好看。这一套连下来,我对它的判断,悄悄从「能用」变成了「敢交给它」。

速度上,体感是比 Claude、GPT 系列更快的。但 Coding 性能这块,真要跟 GPT-5.5、Opus 4.8 这种第一梯队硬碰硬,差距还是看得见。

像多轮复杂修改、大项目的全局把控,这些最吃功力的地方,顶尖模型还是更稳、也更让人放心。

不过 Kimi 也有自己的杀手锏:它做出来的前端页面,是真比大多数模型好看,有审美在的,再加上现在也有多模态的加持。

所以最后说点实在的,给你一个用它的场景:

如果你的活是「编程 + 多模态」这种组合,比如前面那个让它自己读视频、写脚本、把进球片段合出来的需求,又或者甩一张别人 App、网页的界面截图,让它照着仿一个出来,这类场景 Kimi 接得是真不错。

但我也不绕弯子,真要啃硬骨头,有实力、有预算的程序员,大概率还是会继续养着 OpenAI、Claude,该花的钱还是得花,这很正常。

我的建议是,把 Kimi 当成一个「备用位」,而且 Kimi 提升速度又一直在线,真碰上「编程 + 多模态」这类活,或者主力额度烧光了的时候,随手就能顶上来。

相关推荐
TrisighT2 小时前
AI写鸿蒙UI:10个跑崩8个,剩下2个看运气
ai编程·harmonyos·arkts
枫子有风2 小时前
AI编程-Vibe coding(大厂常问问题)
人工智能·ai编程
沉默王二2 小时前
别再写Prompt了!Loop Engineering让Agent自己转起来,一条命令顶你干一天!
agent·ai编程·claude
葫芦和十三3 小时前
Agent 感知|语意压缩
openai·agent·ai编程
乘风gg4 小时前
手把手带你实践历时一年总结的 AI Code Review 最佳工作流!
前端·ai编程·cursor
协享科技4 小时前
AI 视频理解:让 Agent 看视频并总结内容
人工智能·go·音视频·agent·ai编程
承渊政道5 小时前
飞算JavaAI 智能引导背后的多 Agent 协作机制解析:从老旧 Java 后台升级到可运行工程
java·开发语言·spring boot·安全·intellij-idea·软件工程·ai编程
财经资讯数据_灵砚智能5 小时前
基于全球经济类多源新闻的NLP情感分析与数据可视化(日间)2026年6月16日
人工智能·python·ai·信息可视化·自然语言处理·ai编程·灵砚智能
OsDepK13 小时前
OSMDE手机AI编程,一键Git
git·ai编程