让ai执行多轮行动可以把任务变成限定长度的操作,让ai填空,比如我3d模型可以参数化全部给ai,ai返回修改后完全的模型

这个思路其实在多个领域都有对应的研究工作。我找到了一些相关的论文:

Paper Authors Summary
CraftsMan3D: High-fidelity Mesh Generation with 3D Native Generation and Interactive Geometry Refiner Tencent AI Lab et al. 用迭代refiner来优化3D几何------生成初始mesh后通过多轮交互式修正逼近目标
ReFit: Recurrent Fitting Network for 3D Human Recovery --- 用循环网络实现"反馈-更新"循环,每轮输出参数化的3D人体mesh
Outline, Then Details: Syntactically Guided Coarse-To-Fine Code Generation UT Austin 代码生成的多轮策略:先生成轮廓AST,再逐步填充细节------本质是参数化的语法树迭代
PICARD: Parsing Incrementally for Constrained Auto-Regressive Decoding from Language Models ServiceNow, ElementAI 约束解码的经典工作,通过语法规则限制token选择,保证输出始终是有效结构
CRANE: Reasoning with constrained LLM generation --- 代码/symbolic math的约束生成,用上下文无关文法强制输出符合语法
ChopChop: a Programmable Framework for Semantically Constraining the Output of Language Models UC San Diego 用类型系统和程序不变式来约束LM输出,确保语义正确性

关键的 insight 是:把"生成文本"变成"在参数空间搜索",这通常通过以下方式实现:

  1. 约束解码(Constrained Decoding) ------ 用语法/类型系统限制每一步的token选择,保证输出始终是可解析的结构(JSON、代码AST、mesh参数等)

  2. 迭代Refinement ------ 像Diffusion模型或CraftsMan那样,不是一次生成最终答案,而是多轮逐步修正,每轮输出完整的参数向量

  3. 神经反馈循环 ------ ReFit那种结构:当前参数 → 网络 → 修正后的完整参数

你想深入了解哪个方向?比如约束解码的具体实现,或者3D参数化表示的论文?

相关推荐
大龄程序员狗哥2 小时前
第30篇:使用Flask部署你的第一个AI模型——打造简易Web API(项目实战)
前端·人工智能·flask
MobotStone2 小时前
复杂中文不再乱码:GPT Image 2 解决 AI 图像生成最后一块短板
人工智能
数智化精益手记局2 小时前
什么是仓库安灯管理系统?一文讲清仓库安灯管理系统的核心概念
大数据·网络·人工智能·安全·精益工程
sunneo2 小时前
专栏A-AI原生产品设计-06-AI原生产品的未来展望(专栏A终篇)
人工智能·产品运营·产品经理·ai编程·ai-native
AI木马人2 小时前
1.【AI系统架构设计】如何设计一个高效、安全的人性化AI工具系统?(从0到1完整方案)
人工智能·深度学习·神经网络·计算机视觉·自然语言处理
攻防_SRC2 小时前
面向分组密码差分故障分析的属性推导与验证平台
人工智能·算法·机器学习
CV-杨帆2 小时前
Gemma-4 模型部署全记录:从下载到对话(2B/4B)
人工智能
卷Java2 小时前
MCP协议原理与实战:让大模型真正「能动」起来
人工智能·aigc
Captain_Data2 小时前
AI 12小时设计CPU完整解析:从219字到RISC-V内核的技术突破
人工智能·python·ai·大模型·芯片设计·risc-v