让ai执行多轮行动可以把任务变成限定长度的操作,让ai填空,比如我3d模型可以参数化全部给ai,ai返回修改后完全的模型

这个思路其实在多个领域都有对应的研究工作。我找到了一些相关的论文:

Paper Authors Summary
CraftsMan3D: High-fidelity Mesh Generation with 3D Native Generation and Interactive Geometry Refiner Tencent AI Lab et al. 用迭代refiner来优化3D几何------生成初始mesh后通过多轮交互式修正逼近目标
ReFit: Recurrent Fitting Network for 3D Human Recovery --- 用循环网络实现"反馈-更新"循环,每轮输出参数化的3D人体mesh
Outline, Then Details: Syntactically Guided Coarse-To-Fine Code Generation UT Austin 代码生成的多轮策略:先生成轮廓AST,再逐步填充细节------本质是参数化的语法树迭代
PICARD: Parsing Incrementally for Constrained Auto-Regressive Decoding from Language Models ServiceNow, ElementAI 约束解码的经典工作,通过语法规则限制token选择,保证输出始终是有效结构
CRANE: Reasoning with constrained LLM generation --- 代码/symbolic math的约束生成,用上下文无关文法强制输出符合语法
ChopChop: a Programmable Framework for Semantically Constraining the Output of Language Models UC San Diego 用类型系统和程序不变式来约束LM输出,确保语义正确性

关键的 insight 是:把"生成文本"变成"在参数空间搜索",这通常通过以下方式实现:

  1. 约束解码(Constrained Decoding) ------ 用语法/类型系统限制每一步的token选择,保证输出始终是可解析的结构(JSON、代码AST、mesh参数等)

  2. 迭代Refinement ------ 像Diffusion模型或CraftsMan那样,不是一次生成最终答案,而是多轮逐步修正,每轮输出完整的参数向量

  3. 神经反馈循环 ------ ReFit那种结构:当前参数 → 网络 → 修正后的完整参数

你想深入了解哪个方向?比如约束解码的具体实现,或者3D参数化表示的论文?

相关推荐
九酒5 小时前
AI Agent 开发踩坑记:口播功能非得用 APP 原生实现吗?
前端·人工智能·agent
蝎子莱莱爱打怪5 小时前
DSpark 讲透:DeepSeek 不换模型,硬把 V4 提速 85%,是怎么做到的?
人工智能·面试·程序员
巫山老妖7 小时前
置身AI内
人工智能
IT_陈寒9 小时前
JavaScript项目实战经验分享
前端·人工智能·后端
vanuan10 小时前
两个AI智能体第一次对话-A2A双Agent协作实战
人工智能
kfaino12 小时前
码农的AI翻身(四)你好,我叫 Attention
人工智能·后端
雨落Re14 小时前
如何设计一个高质量Skill
人工智能
Token炼金师14 小时前
大模型权重文件全指南:从格式选择到优化实战
人工智能
阿牛哥_GX14 小时前
CDP 浏览器操控原理:让脚本接管你的浏览器
人工智能
ThreeS14 小时前
手搓MiniVLA全实战教程-一步一步用pytorch解释原理与思路
人工智能·python