K2 vs qwen3 vs deepseek v3.1 小测试

用TRAE分别测试了下这几个模型的效果,给了一个爬虫和建站的小任务。

prompt

帮我做一个claude code subagents汇总站,希望有真实的数据。你可以爬取各种汇总站,或者github上的一些subagents集合仓库

kimi-k2

  • ✅页面还算美观,比较素
  • ✅搜索、子页面基本也能打开(gif是没走梯子)。
  • ❌并没有执行爬虫,全部mock数据。

执行过程,确实和claude4相似度比较高,蒸馏石锤

qwen3

  • ❌视觉不是很有眼看,差太远了
  • ✅首先做了检索,用的是真实数据。但是也没有系统的爬虫。-

ds v3.1

  • ✅功能基本是ok的
  • ✅有写爬虫程序并执行,其他两个都没做。幻方出品,爬虫能力很在线。。。
  • ❌视觉太素了,有一点点简陋,但比qwen3强点
  • 第一轮还有error,不是很重要的error,先算过。

结论

K2和ds v3.1还是可以接受的。不过我还是用claude4吧(手动狗头)

相关推荐
Peter·Pan爱编程1 小时前
第二篇:为什么现在是 Vibe Coding 的元年?风险与挑战
人工智能·ai编程
leo825...4 小时前
Claude Code Skills 清单(本地)
java·python·ai编程
DanCheOo5 小时前
开源 | ai-memory v2.6.2:不用配 API Key,一行命令把 Cursor 对话变成结构化知识库
人工智能·ai·ai编程
He少年5 小时前
【AI 辅助案例分享】
人工智能·c#·编辑器·ai编程
叫我王员外就行5 小时前
Claude Code之三大模式
ai编程·claude code
舟遥遥娓飘飘6 小时前
如何解决 Claude Code 频繁授权(权限请求)问题
自动化·ai编程
Peter·Pan爱编程6 小时前
第三篇:10 分钟上手:用自然语言生成一个全栈应用
人工智能·ai编程
win4r6 小时前
🚀AI编程工作流终极形态:GitNexus!零Token消耗实现代码知识图谱化!让Claude Code和Codex拥有上帝视角彻底告别盲目改代码,复杂项目重
ai编程·claude·vibecoding
Peter·Pan爱编程6 小时前
第一篇:什么是 Vibe Coding?核心素养与范式转移
人工智能·ai编程
C澒7 小时前
IntelliPro 产研协作平台:基于 AI Agent 的低代码智能化配置方案设计与实现
前端·低代码·ai编程