让ai执行多轮行动可以把任务变成限定长度的操作,让ai填空,比如我3d模型可以参数化全部给ai,ai返回修改后完全的模型

这个思路其实在多个领域都有对应的研究工作。我找到了一些相关的论文:

Paper Authors Summary
CraftsMan3D: High-fidelity Mesh Generation with 3D Native Generation and Interactive Geometry Refiner Tencent AI Lab et al. 用迭代refiner来优化3D几何------生成初始mesh后通过多轮交互式修正逼近目标
ReFit: Recurrent Fitting Network for 3D Human Recovery --- 用循环网络实现"反馈-更新"循环,每轮输出参数化的3D人体mesh
Outline, Then Details: Syntactically Guided Coarse-To-Fine Code Generation UT Austin 代码生成的多轮策略:先生成轮廓AST,再逐步填充细节------本质是参数化的语法树迭代
PICARD: Parsing Incrementally for Constrained Auto-Regressive Decoding from Language Models ServiceNow, ElementAI 约束解码的经典工作,通过语法规则限制token选择,保证输出始终是有效结构
CRANE: Reasoning with constrained LLM generation --- 代码/symbolic math的约束生成,用上下文无关文法强制输出符合语法
ChopChop: a Programmable Framework for Semantically Constraining the Output of Language Models UC San Diego 用类型系统和程序不变式来约束LM输出,确保语义正确性

关键的 insight 是:把"生成文本"变成"在参数空间搜索",这通常通过以下方式实现:

  1. 约束解码(Constrained Decoding) ------ 用语法/类型系统限制每一步的token选择,保证输出始终是可解析的结构(JSON、代码AST、mesh参数等)

  2. 迭代Refinement ------ 像Diffusion模型或CraftsMan那样,不是一次生成最终答案,而是多轮逐步修正,每轮输出完整的参数向量

  3. 神经反馈循环 ------ ReFit那种结构:当前参数 → 网络 → 修正后的完整参数

你想深入了解哪个方向?比如约束解码的具体实现,或者3D参数化表示的论文?

相关推荐
tedcloud1231 天前
UI-TARS-desktop部署教程:构建AI桌面自动化系统
服务器·前端·人工智能·ui·自动化·github
曦月逸霜1 天前
啥是RAG 它能干什么?
人工智能·python·机器学习
AI医影跨模态组学1 天前
Lancet Digit Health(IF=24.1)广东省人民医院刘再毅&南方医科大学南方医院梁莉等团队:基于可解释深度学习模型预测胶质瘤分子改变
人工智能·深度学习·论文·医学·医学影像·影像组学
应用市场1 天前
AI 编程助手三强争霸(2026 版):Claude、Gemini、GPT 各自擅长什么?
人工智能·gpt
AC赳赳老秦1 天前
供应链专员提效:OpenClaw自动跟踪物流信息、更新库存数据,异常自动提醒
java·大数据·服务器·数据库·人工智能·自动化·openclaw
脑极体1 天前
从Token消耗到DAA增长,AI价值标尺正在重构
人工智能·重构
csdn小瓯1 天前
LangGraph自适应工作流路由机制:从关键词匹配到智能决策的完整实现
人工智能·fastapi·langgraph
QYR-分析1 天前
高功率飞秒激光器行业发展现状、市场机遇及未来趋势分析
大数据·人工智能
AI医影跨模态组学1 天前
J Clin Oncol(IF=43.4)美国Cedars-Sinai医学中心等团队:基于计算组织学人工智能的晚期胰腺癌化疗选择预测性生物标志物的开发与验证
人工智能·机器学习·论文·医学·医学影像·影像组学
冬奇Lab1 天前
RAG 系列(十六):Graph RAG——用知识图谱解决多跳关系问题
人工智能·llm