K2 vs qwen3 vs deepseek v3.1 小测试

用TRAE分别测试了下这几个模型的效果,给了一个爬虫和建站的小任务。

prompt

帮我做一个claude code subagents汇总站,希望有真实的数据。你可以爬取各种汇总站,或者github上的一些subagents集合仓库

kimi-k2

  • ✅页面还算美观,比较素
  • ✅搜索、子页面基本也能打开(gif是没走梯子)。
  • ❌并没有执行爬虫,全部mock数据。

执行过程,确实和claude4相似度比较高,蒸馏石锤

qwen3

  • ❌视觉不是很有眼看,差太远了
  • ✅首先做了检索,用的是真实数据。但是也没有系统的爬虫。-

ds v3.1

  • ✅功能基本是ok的
  • ✅有写爬虫程序并执行,其他两个都没做。幻方出品,爬虫能力很在线。。。
  • ❌视觉太素了,有一点点简陋,但比qwen3强点
  • 第一轮还有error,不是很重要的error,先算过。

结论

K2和ds v3.1还是可以接受的。不过我还是用claude4吧(手动狗头)

相关推荐
GISer_Jing1 天前
Memory、Rules、Skills、MCP如何重塑AI编程
前端·人工智能·aigc·ai编程
github.com/starRTC1 天前
Claude Code中英文系列教程24:使用钩子hooks扩展 Claude Code 的行为
人工智能·ai编程
Testopia1 天前
AI编程实例 - 爆款文章预测:K-Means聚类与分类算法的实践
人工智能·分类·kmeans·ai编程·聚类
ssxueyi1 天前
AI编程之智谱+claude code详细安装使用教程
人工智能·ai编程·智谱·claude code
Aliex_git1 天前
Claude Code 使用笔记(四)- GitHub Claude 审查助手
人工智能·笔记·学习·github·ai编程
RANCE_atttackkk1 天前
使用redis+springboot+langchain4j实现AI对话持久化
java·数据库·spring boot·redis·缓存·ai·ai编程
LeenixP1 天前
GitHub Copilot 调用第三方模型API
ai·github·copilot·ai编程·oai compatible
he___H1 天前
AI编程-----彩票蓝球
ai编程
玄同7651 天前
TRAE Rules 高效使用指南:让 AI 更听话的秘密
ide·人工智能·ai编程·claude·cursor·trae
玉梅小洋2 天前
Claude Code 从入门到精通(四):Hooks从原理到实践
ai·大模型·ai编程·claude·ai工具