K2 vs qwen3 vs deepseek v3.1 小测试

用TRAE分别测试了下这几个模型的效果,给了一个爬虫和建站的小任务。

prompt

帮我做一个claude code subagents汇总站,希望有真实的数据。你可以爬取各种汇总站,或者github上的一些subagents集合仓库

kimi-k2

  • ✅页面还算美观,比较素
  • ✅搜索、子页面基本也能打开(gif是没走梯子)。
  • ❌并没有执行爬虫,全部mock数据。

执行过程,确实和claude4相似度比较高,蒸馏石锤

qwen3

  • ❌视觉不是很有眼看,差太远了
  • ✅首先做了检索,用的是真实数据。但是也没有系统的爬虫。-

ds v3.1

  • ✅功能基本是ok的
  • ✅有写爬虫程序并执行,其他两个都没做。幻方出品,爬虫能力很在线。。。
  • ❌视觉太素了,有一点点简陋,但比qwen3强点
  • 第一轮还有error,不是很重要的error,先算过。

结论

K2和ds v3.1还是可以接受的。不过我还是用claude4吧(手动狗头)

相关推荐
石云升2 小时前
AI编程:每个人的开始,最强的生产力工具
ai编程
倔强的石头_5 小时前
深入实战 Doubao-Seed-Code:从 API 到游戏的端到端双项目指南
ai编程
倔强青铜三20 小时前
AI编程革命:React + shadcn/ui 将终结前端框架之战
前端·人工智能·ai编程
天外飞雨道沧桑21 小时前
前端开发 Cursor MCP 提效工具配置
前端·vscode·ai编程·开发工具·cursor
严老湿1 天前
Spec Kit 实践:从 Prompt 工程到规范驱动开发
ai编程·vibecoding
云起SAAS1 天前
早晚安打卡抖音快手微信小程序看广告流量主开源
微信小程序·小程序·ai编程·看广告变现轻·早晚安打卡
该用户已不存在1 天前
Google Antigravity 测评:免费的智能体 IDE 有多强
后端·ai编程·gemini
魁首1 天前
初识 ACP (Agent Client Protocol)
人工智能·ai编程·mcp
yaocheng的ai分身1 天前
可验证性是极限
ai编程
程序员鱼皮1 天前
7 个 Cursor AI 极限省钱大法,别花冤枉钱!
后端·ai编程·cursor