K2 vs qwen3 vs deepseek v3.1 小测试

用TRAE分别测试了下这几个模型的效果,给了一个爬虫和建站的小任务。

prompt

帮我做一个claude code subagents汇总站,希望有真实的数据。你可以爬取各种汇总站,或者github上的一些subagents集合仓库

kimi-k2

  • ✅页面还算美观,比较素
  • ✅搜索、子页面基本也能打开(gif是没走梯子)。
  • ❌并没有执行爬虫,全部mock数据。

执行过程,确实和claude4相似度比较高,蒸馏石锤

qwen3

  • ❌视觉不是很有眼看,差太远了
  • ✅首先做了检索,用的是真实数据。但是也没有系统的爬虫。-

ds v3.1

  • ✅功能基本是ok的
  • ✅有写爬虫程序并执行,其他两个都没做。幻方出品,爬虫能力很在线。。。
  • ❌视觉太素了,有一点点简陋,但比qwen3强点
  • 第一轮还有error,不是很重要的error,先算过。

结论

K2和ds v3.1还是可以接受的。不过我还是用claude4吧(手动狗头)

相关推荐
IT 行者24 分钟前
Claude之父AI编程技巧二:多平台协同——打破终端边界的全栈开发工作流
ai编程
一条咸鱼_SaltyFish1 小时前
[Day15] 若依框架二次开发改造记录:定制化之旅 contract-security-ruoyi
java·大数据·经验分享·分布式·微服务·架构·ai编程
leluckys2 小时前
AI-大模型-MCP实战指南
ai编程
程序新视界4 小时前
面对AI的飞速发展,我们的职业路径有什么变化?
人工智能·ai编程
DebugEve4 小时前
AI 时代的减法生活:我为什么不再追逐新工具了
aigc·ai编程
draking4 小时前
Anthropic 封杀当天,我把 OpenCode 升到 1.1.11,踩了 5 个坑
macos·ai编程
Smoothzjc4 小时前
别再只把AI当聊天机器人了!揭秘大模型进化的终极形态,看完颠覆你的认知!
后端·langchain·ai编程
IT 行者5 小时前
Claude之父AI编程技巧三:只用Opus 4.5 + 思考模式——释放Claude Code的全部潜力
ai编程
IT 行者6 小时前
Claude之父AI编程技巧四:共享团队CLAUDE.md——打造统一的项目智能指南
数据库·ai编程
IT 行者7 小时前
Claude之父AI编程技巧一:并行终端 + 系统通知——将Claude Code变成你的超级开发团队
ai编程·claude