[论文阅读] 人工智能 | 大语言模型计划生成的新范式：基于过程挖掘的技能学习

张较瘦_2025-06-07 18:08

#论文阅读#

大语言模型计划生成的新范式：基于过程挖掘的技能学习

论文信息

Skill Learning Using Process Mining for Large Language Model Plan Generation

Andrei Cosmin Redis, Mohammadreza Fani Sani, Bahram Zarrin, Andrea Burattin

Cite as: arXiv:2410.12870 [cs.CL] (or arXiv:2410.12870v1 [cs.CL] for this version)

https://doi.org/10.48550/arXiv.2410.12870

研究背景：当LLMs遇到复杂任务的"绊脚石"

想象你让AI规划一场跨国会议，传统大语言模型（LLMs）可能会生成一个线性步骤列表：先订会议室、再发邮件、最后准备资料。但现实中，这些步骤可能可以并行进行（比如订会议室的同时预约咖啡），而LLMs却因缺乏"结构化控制流模型"，只能按顺序执行，效率低下且难以复用类似场景的经验。

这就像用简单的菜谱列表做满汉全席：每个步骤孤立执行，无法发现"预处理食材"和"调制酱汁"可以同时进行，也无法将"宴会流程"作为通用技能复用到其他活动中。现有文本规划器的核心痛点在于：

线性思维限制效率：只能生成扁平动作序列，无法识别并行任务（如同时预订会议室和发送邀请）。
缺乏结构导致"失忆"：相似任务需从头规划，无法复用历史技能（如重复生成"安排会议"的步骤）。
黑箱决策难解释：用户难以理解为什么AI选择某一步骤，调试和优化困难。

创新点：给LLMs装上"流程显微镜"

论文的核心突破是将**过程挖掘（Process Mining）**技术引入LLMs，让AI从历史生成的动作序列中提取"技能模型"，就像从大量烹饪记录中总结出标准化菜谱流程：

技能发现：用过程挖掘算法（如归纳矿工）从LLM生成的动作序列中提炼结构化控制流模型，例如将"安排会议"的不同执行痕迹整合成包含并行步骤（预订房间+准备资料）的流程模型。
技能存储与检索：将模型存入"技能库"，通过"一致性检查"（Conformance Checking）匹配当前任务需求，确保检索的技能在结构上与目标任务对齐，而非仅靠文本语义相似性。
并行执行与可解释性：结构化模型允许AI识别可并行的任务分支，缩短执行时间，同时让用户直观看到步骤间的逻辑关系。

研究方法和思路：三步搭建智能规划系统

1. 从"流水账"到"流程图"：过程发现提取技能

输入：LLM生成的动作序列（如"预订会议室→发送邮件→准备资料"）。
处理：使用归纳矿工算法分析序列，识别动作间的顺序、并行关系，生成BPMN或Petri网格式的流程模型。例如，发现"预订会议室"和"准备资料"可并行执行，合并为"会议准备"技能。
输出：结构化技能模型，存入技能库。

2. 技能库：让LLMs"记住"历史经验

存储形式：每个技能是一个包含控制流结构的模型，记录动作间的依赖关系和并行可能。
复用机制：当新任务与历史任务相似时，LLM无需从头生成计划，直接从技能库检索匹配模型，像调用函数一样复用经验。

3. 精准匹配：一致性检查提升检索质量

单阶段方法：仅用一致性检查，通过"对齐适应度"指标衡量生成计划与技能模型的结构匹配度，避免因文本表述差异导致的误匹配（如"安排会议"和"组织会谈"可能对应同一模型）。
两阶段方法：先通过文本语义嵌入（如ada-002）快速过滤候选技能，再用一致性检查重新排序，平衡效率与准确性。

实验验证：结构化模型真的有用吗？

数据集：使用ProcessTBench（含LLM生成的532个任务轨迹）和TaskBench（533个多语言重述任务）。
关键发现 ：
- 过程挖掘能有效从LLM轨迹中提取高保真模型，平均"重放适应度"0.96，"对齐适应度"0.94，表明模型与真实流程高度吻合。
- 在技能检索中，两阶段方法（ada-002+一致性检查）的F1分数达0.90，MRR达0.93，接近纯语义模型（ada-002），但在规划器准确率≥0.7时表现更优，且更具可解释性。

主要贡献：让LLMs从"新手"变"专家"

填补文本规划与代码规划的鸿沟：赋予文本型LLMs类似代码规划器的结构化控制流能力，无需依赖代码生成即可实现技能复用和并行执行。
提升效率与透明度 ：
- 并行执行可缩短任务时间，如TaskBench中查询响应速度提升1.43倍。
- 结构化模型让用户清晰看到AI决策逻辑，便于调试和优化自动化流程。
开创过程挖掘与LLMs的交叉应用：首次将过程挖掘技术用于LLM的技能学习，为自动化规划提供了可解释、可复用的新框架。

总结：未来已来，但仍需探索

论文通过实验证明，过程挖掘与LLMs的结合能有效提升复杂任务的规划效率和可解释性，为企业自动化、智能代理等场景提供了新路径。然而，当前研究仍基于合成数据集，未来需在真实场景中验证，同时探索更复杂的规划器设计和开放集技能检索。

一句话总结：给LLMs一套"流程建模工具"，让它学会从历史经验中提炼可复用的结构化技能，像人类一样高效规划复杂任务。

上一篇：在WordPress上添加隐私政策页面

下一篇：【Visual Studio 2022】卸载安装，ASP.NET

热门推荐

01GitHub 镜像站点 02OpenClaw 使用和管理 MCP 完全指南 03OpenClaw + 飞书（Feishu）环境搭建指南 04Claude Code + GLM4.7 避坑指南：解决 Unable to connect to Anthropic services 05OpenClaw优化飞书API 额度已耗尽问题 06小黑课堂计算机二级WPSoffice题库软件下载安装教程（2026年3月最新版）07Clawdbot部署教程：解决‘gateway token missing’授权问题的完整步骤 08Window 10部署openclaw报错node.exe : npm error code 128 09网站改了域名，如何查找？10【OpenClaw 本地实战 Ep.3】突破瓶颈：强制修改 openclaw.json 解锁 32k 上下文记忆