用LLM+CadQuery自动生成CAD模型:CAD-Coder让文本秒变3D零件

你有没有过这样的经历?想画个法兰盘的CAD模型,得打开专业软件、调坐标系、画草图、做拉伸......步骤繁琐还得熟稔操作逻辑。现在,基于大语言模型(LLM)和CadQuery的CAD-Coder方案,能让你输入一段零件描述,直接生成可执行的CAD代码------今天我们就来拆解这个让CAD建模"动口不动手"的技术!

一、从文本到3D模型:不同表示方式的对比

先看一个法兰盘的例子:

  • 文本描述:只需要说明"120mm直径的金属法兰盘,15mm厚,中心50mm孔,6个12mm安装孔(分布在90mm圆周),还有70mm外径、8mm高的凸环"。
  • DeepCAD表示 :是一套自定义的命令序列(比如SOL_Circle 0 0 60),虽然能生成模型,但语法封闭、不易扩展。
  • CadQuery表示 :直接用Python代码实现(比如cq.Workplane("XY").circle(60).circle(25).extrude(15)),既贴合工程习惯,又能直接在CadQuery中执行生成3D模型。

更直观的是"分步建模":操作1画底座、操作2打安装孔、操作3加凸环,每一步的代码和模型都清晰对应,出错了也能精准调试。

二、CAD-Coder怎么训练?让LLM学会"逻辑建模"

CAD-Coder的训练 pipeline :

输入是零件文本描述+对应的CadQuery代码 ,经过有监督微调(SFT)的LLMGRPO优化策略,让模型学会"有逻辑地生成代码"------生成前会先做"思考":

  1. 分析文本描述的零件特征;
  2. 规划坐标系(比如以零件中心为原点);
  3. 设计草图的绘制顺序;
  4. 确定拉伸/切割的操作参数......

这种"先思考、再编码"的方式,让生成的CadQuery代码更贴合工程实际,不是盲目拼接语法。

三、高质量数据集:靠"择优"搞定标注

要训练LLM,得有文本-CadQuery-3D模型的三元组数据,但现有Text2CAD数据集只有命令序列。怎么办?

我们用标注 pipeline 自动"择优"

  1. 用DeepSeek-V3生成多个CadQuery代码候选;
  2. 执行每个候选代码,得到对应的3D模型;
  3. 计算生成模型与"真值模型"的Chamfer Distance(CD,衡量3D模型相似度)
  4. 保留CD最小、能成功执行的代码,组成最终数据集。

这个流程既解决了数据缺失问题,又保证了代码的准确性------毕竟"能生成和真值一致的3D模型"才是硬标准。

为什么这个方案更实用?

  1. CadQuery的优势:基于Python的开源库,代码可复用、易修改,工程师不用学新语法;
  2. 可解释性强:分步建模的逻辑和CAD软件操作一致,出错了能定位到具体代码行;
  3. 数据集质量高:通过Chamfer Distance筛选,避免了"代码能跑但模型不对"的情况。

这个方案把LLM的自然语言理解能力和CadQuery的工程实用性结合,让非专业人员也能快速生成CAD模型。未来还能扩展到带螺纹、倒角的复杂零件~

总结

当前 CAD Coder 虽实现了文本到 CAD 模型的自动化转换,但仍存局限性:

  1. 数据集多聚焦简单零件(如基础法兰、凸台),对复杂装配体、自由曲面或带精密公差的零件支持不足,难覆盖实际工程的高复杂度需求;
  2. 生成代码侧重几何形状还原,缺乏对加工工艺、尺寸链约束、装配兼容性等工程实用信息的考量,模型易 "可看不可用";
  3. 交互灵活性有限,暂不支持自然语言驱动的实时迭代修改,且对行业专属术语的歧义处理能力较弱。

其未来趋势将更贴近工程实际:一方面会拓展融合装配关系、公差、工艺参数的高质量数据集,提升复杂场景适配性;另一方面会强化交互与工程知识融合,支持自然语言增量编辑、自动嵌入工艺约束,探索草图 + 文本的多模态协同建模;同时会推进与主流 CAD 软件的生态集成,实现代码向专业工具的无缝导入,并针对机械、航空等领域做定制化优化,让文本驱动建模真正落地生产流程。

相关推荐
踩着两条虫1 小时前
AI 智能体如何重构开发工作流
前端·人工智能·低代码
大模型真好玩1 小时前
大模型训练全流程实战指南工具篇(八)——EasyDataset问答数据集生成流程
人工智能·langchain·deepseek
Johny_Zhao3 小时前
OpenClaw中级到高级教程
linux·人工智能·信息安全·kubernetes·云计算·yum源·系统运维·openclaw
比尔盖茨的大脑4 小时前
AI Agent 架构设计:从 ReAct 到 Multi-Agent 系统
前端·人工智能·全栈
后端小肥肠5 小时前
OpenClaw 实战|多 Agent 打通小红书:数据收集 + 笔记编写 + 自动发布一步到位
人工智能·aigc·agent
银河系搭车客指南5 小时前
OpenClaw 多 Agent 实战指南:Multi-Agent Routing 与 Sub-Agents 的正确打开方式
人工智能
手机不死我是天子5 小时前
拆解大模型二:Transformer 最核心的设计,其实你高中就学过
人工智能·llm
gustt5 小时前
MCP协议进阶:构建多工具Agent实现智能查询与浏览器交互
人工智能·agent·mcp
Halo咯咯5 小时前
Claude Code 的工程哲学:缓存与工具设计的真实教训 | 经验分享
人工智能
风象南6 小时前
最适合新手先装的 20 个 OpenClaw Skills 来了!
人工智能