K2 vs qwen3 vs deepseek v3.1 小测试

用TRAE分别测试了下这几个模型的效果,给了一个爬虫和建站的小任务。

prompt

帮我做一个claude code subagents汇总站,希望有真实的数据。你可以爬取各种汇总站,或者github上的一些subagents集合仓库

kimi-k2

  • ✅页面还算美观,比较素
  • ✅搜索、子页面基本也能打开(gif是没走梯子)。
  • ❌并没有执行爬虫,全部mock数据。

执行过程,确实和claude4相似度比较高,蒸馏石锤

qwen3

  • ❌视觉不是很有眼看,差太远了
  • ✅首先做了检索,用的是真实数据。但是也没有系统的爬虫。-

ds v3.1

  • ✅功能基本是ok的
  • ✅有写爬虫程序并执行,其他两个都没做。幻方出品,爬虫能力很在线。。。
  • ❌视觉太素了,有一点点简陋,但比qwen3强点
  • 第一轮还有error,不是很重要的error,先算过。

结论

K2和ds v3.1还是可以接受的。不过我还是用claude4吧(手动狗头)

相关推荐
飞哥数智坊11 小时前
AI 编程太混乱?我的3个实践,防止代码失控
人工智能·ai编程
ITZHIHONH12 小时前
FastGPT源码解析 Agent 智能体插件实现代码分析
ai·开源·ai编程
coder_pig13 小时前
👦抠腚男孩的AI学习之旅 | 7、LangChain (三) - 实战:知识库问答机器人 (RAG )
langchain·aigc·ai编程
动能小子ohhh15 小时前
AI智能体(Agent)大模型入门【2】--基于llamaindx部署本地的聊天模型。
人工智能·python·aigc·ai编程
CoderJia程序员甲15 小时前
GitHub 热榜项目 - 日榜(2025-09-11)
ai·开源·github·ai编程·github热榜
该用户已不存在15 小时前
腾讯放大招,Claude Code 国产平替发布
人工智能·ai编程
程序员老刘16 小时前
CTO紧急叫停AI编程!不是技术倒退,而是...
flutter·ai编程
.NET修仙日记16 小时前
Visual Studio 2026 震撼发布!AI 智能编程时代正式来临
ide·微软·ai编程·开发工具·visual studio·编程革命
量子位17 小时前
DeepDiver-V2来了,华为最新开源原生多智能体系统,“团战”深度研究效果惊人
ai编程·deepseek
量子位17 小时前
姚顺雨离职OpenAI,开启下半场
openai·ai编程