用LLM+CadQuery自动生成CAD模型:CAD-Coder让文本秒变3D零件

你有没有过这样的经历?想画个法兰盘的CAD模型,得打开专业软件、调坐标系、画草图、做拉伸......步骤繁琐还得熟稔操作逻辑。现在,基于大语言模型(LLM)和CadQuery的CAD-Coder方案,能让你输入一段零件描述,直接生成可执行的CAD代码------今天我们就来拆解这个让CAD建模"动口不动手"的技术!

一、从文本到3D模型:不同表示方式的对比

先看一个法兰盘的例子:

  • 文本描述:只需要说明"120mm直径的金属法兰盘,15mm厚,中心50mm孔,6个12mm安装孔(分布在90mm圆周),还有70mm外径、8mm高的凸环"。
  • DeepCAD表示 :是一套自定义的命令序列(比如SOL_Circle 0 0 60),虽然能生成模型,但语法封闭、不易扩展。
  • CadQuery表示 :直接用Python代码实现(比如cq.Workplane("XY").circle(60).circle(25).extrude(15)),既贴合工程习惯,又能直接在CadQuery中执行生成3D模型。

更直观的是"分步建模":操作1画底座、操作2打安装孔、操作3加凸环,每一步的代码和模型都清晰对应,出错了也能精准调试。

二、CAD-Coder怎么训练?让LLM学会"逻辑建模"

CAD-Coder的训练 pipeline :

输入是零件文本描述+对应的CadQuery代码 ,经过有监督微调(SFT)的LLMGRPO优化策略,让模型学会"有逻辑地生成代码"------生成前会先做"思考":

  1. 分析文本描述的零件特征;
  2. 规划坐标系(比如以零件中心为原点);
  3. 设计草图的绘制顺序;
  4. 确定拉伸/切割的操作参数......

这种"先思考、再编码"的方式,让生成的CadQuery代码更贴合工程实际,不是盲目拼接语法。

三、高质量数据集:靠"择优"搞定标注

要训练LLM,得有文本-CadQuery-3D模型的三元组数据,但现有Text2CAD数据集只有命令序列。怎么办?

我们用标注 pipeline 自动"择优"

  1. 用DeepSeek-V3生成多个CadQuery代码候选;
  2. 执行每个候选代码,得到对应的3D模型;
  3. 计算生成模型与"真值模型"的Chamfer Distance(CD,衡量3D模型相似度)
  4. 保留CD最小、能成功执行的代码,组成最终数据集。

这个流程既解决了数据缺失问题,又保证了代码的准确性------毕竟"能生成和真值一致的3D模型"才是硬标准。

为什么这个方案更实用?

  1. CadQuery的优势:基于Python的开源库,代码可复用、易修改,工程师不用学新语法;
  2. 可解释性强:分步建模的逻辑和CAD软件操作一致,出错了能定位到具体代码行;
  3. 数据集质量高:通过Chamfer Distance筛选,避免了"代码能跑但模型不对"的情况。

这个方案把LLM的自然语言理解能力和CadQuery的工程实用性结合,让非专业人员也能快速生成CAD模型。未来还能扩展到带螺纹、倒角的复杂零件~

总结

当前 CAD Coder 虽实现了文本到 CAD 模型的自动化转换,但仍存局限性:

  1. 数据集多聚焦简单零件(如基础法兰、凸台),对复杂装配体、自由曲面或带精密公差的零件支持不足,难覆盖实际工程的高复杂度需求;
  2. 生成代码侧重几何形状还原,缺乏对加工工艺、尺寸链约束、装配兼容性等工程实用信息的考量,模型易 "可看不可用";
  3. 交互灵活性有限,暂不支持自然语言驱动的实时迭代修改,且对行业专属术语的歧义处理能力较弱。

其未来趋势将更贴近工程实际:一方面会拓展融合装配关系、公差、工艺参数的高质量数据集,提升复杂场景适配性;另一方面会强化交互与工程知识融合,支持自然语言增量编辑、自动嵌入工艺约束,探索草图 + 文本的多模态协同建模;同时会推进与主流 CAD 软件的生态集成,实现代码向专业工具的无缝导入,并针对机械、航空等领域做定制化优化,让文本驱动建模真正落地生产流程。

相关推荐
美狐美颜sdk5 分钟前
AI加持下的直播美颜sdk:动态贴纸功能的未来形态前瞻
人工智能·美颜sdk·直播美颜sdk·第三方美颜sdk·人脸美型sdk
火山引擎开发者社区8 分钟前
Force 开发者日:火山引擎 Agent 开发者生态全面升级
人工智能·火山引擎
智算菩萨8 分钟前
从对话系统到对话式智能体:对话式AI发展综述与2025年前沿整合
人工智能
yiersansiwu123d8 分钟前
AI时代的就业变革:在替代与创造中寻找平衡之道
人工智能
前进的李工20 分钟前
零知识证明:不泄露秘密也能自证
人工智能·web安全·区块链·零知识证明
Tony Bai21 分钟前
Cloudflare 2025 年度报告发布——Go 语言再次“屠榜”API 领域,AI 流量激增!
开发语言·人工智能·后端·golang
寰宇视讯21 分钟前
IDC:奥哲,2025H1蝉联第一!
人工智能
沛沛老爹31 分钟前
Web开发者快速上手AI Agent:基于LangChain的提示词应用优化实战
人工智能·python·langchain·提示词·rag·web转型
宁大小白31 分钟前
pythonstudy Day39
python·机器学习
FONE_Platform32 分钟前
FONE食品饮料行业全面预算解决方案:构建韧性增长
人工智能·算法·全面预算·全面预算管理系统·企业全面预算