Auto-Coder用Qwen3-Coder-30B-A3B-Instruct模型写一个学习汉字的项目

前面已经用Trae做了一个学习汉字的项目,但是需要一直修修补补,于是想让Auto-Coder也来做一下这个项目试试。

大模型就用Qwen3-Coder-30B-A3B-Instruct,是在SCNet用双DCU 环境,VLLM部署的。部署的时候也碰到很多问题,索性最后都解决了。

模型选型

并不是一开始就决定使用Qwen3-Coder-30B-A3B-Instruct模型,而是测试了很多模型。

尝试使用gitcode提供的免费模型deepseek-ai/DeepSeek-V3.2-Exp和Qwen/Qwen3-Coder-480B-A35B-Instruct,结果发现它们只提供了8k的输出(就是token只有8k),根本没法用,所以只能放弃。

也尝试过G4F的gpt4o-mini等模型,但是最近G4F的稳定性实在太差了,就没找到一个能用的模型。

还尝试过qwq-32b这个模型,它智商不够。

最终还是Qwen3-Coder-30B-A3B-Instruct模型可以一战!

prompt1 :根据语文教材,基于 Hanzi Writer 开源项目开发的一个汉字学习工具,专为小学生设计的同步练习软件。

prompt2:帮我制作一个帮助小学生学习汉字笔画、拼音的小程序,技术实现基于 Hanzi Writer 开源项目。汉字集

和分年级,汉字可以批量导入和单独写入。

几轮交互之后,效果还可以:

解决一些问题:

扩充汉字,在源码里将一年级到六年级的字都补上

增加一个后台添加自定义字符。这样用户可以选择 1后台统计添加自定义字符 2 在界面里手动添加汉字

现在看看检查书写的逻辑是否有问题。我点了"检查书写",没有任何提示,只是书写区域变灰,不能再书写了

测验模式,只看到选项,没有看到题

清除用户书写后,尽管进入了代写状态,但是无法再次书写

"测试模式"下,即使全部答对,也只能获得80分,你解决一下这个问题:你的得分:4/5 (80%)

有些汉字不能播放笔画动画,比如"草",请查找问题并解决!

调试

添加模型一直报错

主要是我先升级到2.0.31 ,报错。又降级到2.0.28,还是一样报错。

coding@auto-coder.chat:~$ /models /add_provider gitcodedeepseek321 model_name="deepseek-ai/DeepSeek-V3.2-Exp" base_url="

https://api-ai.gitcode.com/v1/chat/completions" api_key=hello

Error chating with model: Failed to create LLM instance for models: gitcodedeepseek321

在想,是不是应该用byzer来中转了.....

使用1.0.44版本配置gitcode的大模型报错

配置没有问题,是调用的时候显示:

复制代码
 1. An error occurred: NotFoundError - <html>
<head><title>404 Not Found</title></head>
<body>
<center><h1>404 Not Found</h1></center>
<hr><center>openresty</center>
</body>
</html>

Auto-Coder的模型配置总是问题比较多

发现配置的时候没有加上v1 ,加上:

复制代码
  {
    "name": "gitcodeqw3",
    "description": "",
    "model_name": "Qwen/Qwen3-Coder-480B-A35B-Instruct",
    "model_type": "saas/openai",
    "base_url": "https://api-ai.gitcode.com/v1",
    "provider": null,
    "is_reasoning": false,
    "input_price": 0.0,
    "output_price": 0.0,
    "max_output_tokens": 8096,
    "context_window": 32768,
    "api_key_path": "gitcodeqw3",
    "api_key": null
  }

1.0.44 加上v1后报错:

复制代码
coding@auto-coder.chat:~$ 帮我制作一个帮助小学生学习汉字笔画、拼音的小程序,技术实现基于 Hanzi Writer 开源项目。汉字集
和分年级,汉字可以批量导入和单独写入。
────────────────────────────────────────── Starting Agentic Edit: xuexihanzi ───────────────────────────────────────────
╭───────────────────────────────────────────────────── Objective ──────────────────────────────────────────────────────╮
│ User Query:                                                                                                          │
│ 帮我制作一个帮助小学生学习汉字笔画、拼音的小程序,技术实现基于 Hanzi Writer                                          │
│ 开源项目。汉字集和分年级,汉字可以批量导入和单独写入。                                                               │
╰──────────────────────────────────────────────────────────────────────────────────────────────────────────────────────╯
Conversation ID: 6faa912e-3152-4f78-bbf5-4bfbc45f01d3
conversation tokens: 19117 (conversation round: 1)
这个问题我暂时无法回答,让我们换个话题再聊聊吧。conversation tokens: 19225 (conversation round: 3)

所以gitcode的模型根本没法在Auto-Coder里面用啊,白嫖是不可能了。

后来换了Qwen3-Coder-30B-A3B-Instruct模型,这个模型在SCNet使用双DCU VLLM部署的,需要7元/小时。当然咱有优惠券可以用。

相关推荐
supericeice几秒前
创邻科技 AI智算一体机:支持 DeepSeek 671B 与 Qwen3 单机部署,覆盖纯CPU到多GPU多机扩展
大数据·人工智能·科技
لا معنى له27 分钟前
Var-JEPA:联合嵌入预测架构的变分形式 —— 连接预测式与生成式自监督学习 ----论文翻译
人工智能·笔记·学习·语言模型
智慧景区与市集主理人27 分钟前
巨有科技云票务,破解景区五一运营的入园难“效率瓶颈”
大数据·人工智能·科技
世人万千丶28 分钟前
Flutter 框架跨平台鸿蒙开发 - 宠物语言翻译器应用
学习·flutter·华为·开源·harmonyos·鸿蒙
AI成长日志31 分钟前
【笔面试算法学习专栏】哈希表基础:两数之和与字母异位词分组
学习·算法·面试
2501_9333295531 分钟前
企业媒体发布与舆情管理实战:Infoseek舆情系统技术架构与落地解析
大数据·开发语言·人工智能·数据库开发
"菠萝"34 分钟前
C#知识学习-021(文字关键字)
开发语言·学习·c#
Are_You_Okkk_34 分钟前
AI原生与外挂的区别:开源知识库的优势及优化方向
大数据·人工智能·开源
xinlianyq34 分钟前
2026 边缘智能的崛起:端云协同架构下的“词元”调度艺术
人工智能·架构·api
2301_7807896637 分钟前
零信任架构在云安全落地过程中的最佳实践
服务器·人工智能·游戏·架构·零信任