[论文阅读] 人工智能 | 大语言模型计划生成的新范式:基于过程挖掘的技能学习

#论文阅读#

大语言模型计划生成的新范式:基于过程挖掘的技能学习

论文信息

Skill Learning Using Process Mining for Large Language Model Plan Generation

Andrei Cosmin Redis, Mohammadreza Fani Sani, Bahram Zarrin, Andrea Burattin

Cite as: arXiv:2410.12870 [cs.CL] (or arXiv:2410.12870v1 [cs.CL] for this version)

https://doi.org/10.48550/arXiv.2410.12870

研究背景:当LLMs遇到复杂任务的"绊脚石"

想象你让AI规划一场跨国会议,传统大语言模型(LLMs)可能会生成一个线性步骤列表:先订会议室、再发邮件、最后准备资料。但现实中,这些步骤可能可以并行进行(比如订会议室的同时预约咖啡),而LLMs却因缺乏"结构化控制流模型",只能按顺序执行,效率低下且难以复用类似场景的经验。

这就像用简单的菜谱列表做满汉全席:每个步骤孤立执行,无法发现"预处理食材"和"调制酱汁"可以同时进行,也无法将"宴会流程"作为通用技能复用到其他活动中。现有文本规划器的核心痛点在于:

  • 线性思维限制效率:只能生成扁平动作序列,无法识别并行任务(如同时预订会议室和发送邀请)。
  • 缺乏结构导致"失忆":相似任务需从头规划,无法复用历史技能(如重复生成"安排会议"的步骤)。
  • 黑箱决策难解释:用户难以理解为什么AI选择某一步骤,调试和优化困难。

创新点:给LLMs装上"流程显微镜"

论文的核心突破是将**过程挖掘(Process Mining)**技术引入LLMs,让AI从历史生成的动作序列中提取"技能模型",就像从大量烹饪记录中总结出标准化菜谱流程:

  • 技能发现:用过程挖掘算法(如归纳矿工)从LLM生成的动作序列中提炼结构化控制流模型,例如将"安排会议"的不同执行痕迹整合成包含并行步骤(预订房间+准备资料)的流程模型。
  • 技能存储与检索:将模型存入"技能库",通过"一致性检查"(Conformance Checking)匹配当前任务需求,确保检索的技能在结构上与目标任务对齐,而非仅靠文本语义相似性。
  • 并行执行与可解释性:结构化模型允许AI识别可并行的任务分支,缩短执行时间,同时让用户直观看到步骤间的逻辑关系。

研究方法和思路:三步搭建智能规划系统

1. 从"流水账"到"流程图":过程发现提取技能

  • 输入:LLM生成的动作序列(如"预订会议室→发送邮件→准备资料")。
  • 处理:使用归纳矿工算法分析序列,识别动作间的顺序、并行关系,生成BPMN或Petri网格式的流程模型。例如,发现"预订会议室"和"准备资料"可并行执行,合并为"会议准备"技能。
  • 输出:结构化技能模型,存入技能库。

2. 技能库:让LLMs"记住"历史经验

  • 存储形式:每个技能是一个包含控制流结构的模型,记录动作间的依赖关系和并行可能。
  • 复用机制:当新任务与历史任务相似时,LLM无需从头生成计划,直接从技能库检索匹配模型,像调用函数一样复用经验。

3. 精准匹配:一致性检查提升检索质量

  • 单阶段方法:仅用一致性检查,通过"对齐适应度"指标衡量生成计划与技能模型的结构匹配度,避免因文本表述差异导致的误匹配(如"安排会议"和"组织会谈"可能对应同一模型)。
  • 两阶段方法:先通过文本语义嵌入(如ada-002)快速过滤候选技能,再用一致性检查重新排序,平衡效率与准确性。

实验验证:结构化模型真的有用吗?

  • 数据集:使用ProcessTBench(含LLM生成的532个任务轨迹)和TaskBench(533个多语言重述任务)。
  • 关键发现
    • 过程挖掘能有效从LLM轨迹中提取高保真模型,平均"重放适应度"0.96,"对齐适应度"0.94,表明模型与真实流程高度吻合。
    • 在技能检索中,两阶段方法(ada-002+一致性检查)的F1分数达0.90,MRR达0.93,接近纯语义模型(ada-002),但在规划器准确率≥0.7时表现更优,且更具可解释性。

主要贡献:让LLMs从"新手"变"专家"

  1. 填补文本规划与代码规划的鸿沟:赋予文本型LLMs类似代码规划器的结构化控制流能力,无需依赖代码生成即可实现技能复用和并行执行。
  2. 提升效率与透明度
    • 并行执行可缩短任务时间,如TaskBench中查询响应速度提升1.43倍。
    • 结构化模型让用户清晰看到AI决策逻辑,便于调试和优化自动化流程。
  3. 开创过程挖掘与LLMs的交叉应用:首次将过程挖掘技术用于LLM的技能学习,为自动化规划提供了可解释、可复用的新框架。

总结:未来已来,但仍需探索

论文通过实验证明,过程挖掘与LLMs的结合能有效提升复杂任务的规划效率和可解释性,为企业自动化、智能代理等场景提供了新路径。然而,当前研究仍基于合成数据集,未来需在真实场景中验证,同时探索更复杂的规划器设计和开放集技能检索。

一句话总结:给LLMs一套"流程建模工具",让它学会从历史经验中提炼可复用的结构化技能,像人类一样高效规划复杂任务。

相关推荐
一切皆有可能!!4 小时前
实践篇:利用ragas在自己RAG上实现LLM评估②
人工智能·语言模型
月白风清江有声5 小时前
爆炸仿真的学习日志
人工智能
华奥系科技7 小时前
智慧水务发展迅猛:从物联网架构到AIoT系统的跨越式升级
人工智能·物联网·智慧城市
R²AIN SUITE7 小时前
MCP协议重构AI Agent生态:万能插槽如何终结工具孤岛?
人工智能
b***25117 小时前
动力电池点焊机:驱动电池焊接高效与可靠的核心力量|比斯特自动化
人工智能·科技·自动化
Gyoku Mint7 小时前
机器学习×第二卷:概念下篇——她不再只是模仿,而是开始决定怎么靠近你
人工智能·python·算法·机器学习·pandas·ai编程·matplotlib
小和尚同志7 小时前
通俗易懂的 MCP 概念入门
人工智能·aigc
dudly8 小时前
大语言模型评测体系全解析(下篇):工具链、学术前沿与实战策略
人工智能·语言模型
zzlyx998 小时前
AI大数据模型如何与thingsboard物联网结合
人工智能·物联网