SAUP 算法

要理解这个情境感知不确定性传播(SAUP)算法 ,我们可以从模块拆解、逻辑流程、核心设计三个维度逐步解析:

一、算法核心目标

SAUP 算法的目标是量化基于大语言模型(LLM)的智能体在问题解决过程中的整体不确定性,通过为"推理步骤分配情境权重",更精准地评估智能体对当前情境的感知可靠性。

二、算法模块拆解与步骤解析

1. 初始化阶段
  • Initialize the N-Step LLM-based Agent L_θ with the problem Q, and the Z_n = {(A₁,T₁,O₁),(A₂,T₂,O₂),...,(Aₙ,Tₙ,Oₙ)}.
    • 解释:用问题 ( Q ) 初始化一个包含 ( N ) 步推理的 LLM 智能体 ( L_θ ),并定义推理轨迹集合 ( Z_n )------其中每个元素 ( (A_i, T_i, O_i) ) 代表智能体的"行动 ( A_i )、思考 ( T_i )、观察 ( O_i )"三元组(即每一步的推理信息)。
2. 逐步骤计算"步骤不确定性"与"情境距离"

循环遍历每一个推理步骤 ( n ):

  • 步骤不确定性计算The Uncertainty for current step U_n^R ← H(R_n | Q, Z_{n-1})
    • 解释:用熵函数 ( H ) 计算当前步骤 ( n ) 的"局部不确定性 ( U_n^R )"。其中 ( R_n ) 是步骤 ( n ) 的推理结果,( Q ) 是原始问题,( Z_{n-1} ) 是前 ( n-1 ) 步的推理轨迹。熵越大,说明该步骤的推理结果越不确定。
  • 全局偏离距离(查询偏移)D_{a_n} ← Dis(Z_n, Q)
    • 解释:计算推理轨迹 ( Z_n ) 与原始问题 ( Q ) 的全局语义偏离程度(即"查询偏移 ( D_{a_n} )")。偏离越大,说明推理越远离问题核心。
  • 局部偏离距离(推理间隙)D_{o_n} ← Dis(A_n, O_n)
    • 解释:计算步骤 ( n ) 中"行动 ( A_n )"与"观察 ( O_n )"的局部逻辑偏离程度(即"推理间隙 ( D_{o_n} )")。偏离越大,说明该步骤的"思考-行动-观察"逻辑越断裂。
3. 情境权重的两种计算分支(应对"精确权重难以获取"的问题)

这部分对应你之前问的"基于距离和基于位置的替代方法"的基于距离分支,通过"距离"量化情境权重:

  • 分支1:基于CHMM的权重计算
    • if using the CHMM as the surrogates then Add the (D_{a_n} + D_{o_n}) into the D_L
    • 解释:若采用**连续隐马尔可夫模型(CHMM)**作为"情境权重的代理模型",则先将当前步骤的"全局偏离 + 局部偏离"(( D_{a_n} + D_{o_n} ))存入距离列表 ( D_L )。
    • 后续统一计算权重:(W₁, W₂, ..., W_N) ← H(D_L) = H((D_{a₁}+D_{o₁}), ..., (D_{a_N}+D_{o_N}))
      • 用熵函数 ( H ) 对 ( D_L ) 中所有步骤的总偏离度建模,得到每个步骤的情境权重 ( W_n )
  • 分支2:基于Plain-Distance的权重计算
    • else Using the Plain-Distance as the surrogates W_n ← D_{a_n} + D_{o_n}
    • 解释:若采用朴素距离法 ,则直接将"全局偏离 + 局部偏离"的和作为当前步骤的情境权重 ( W_n )
4. 整体不确定性聚合
  • The Uncertainty for the agent U_{agent} ← SAUP((U₁,W₁), (U₂,W₂), ..., (U_N,W_N))
    • 解释:将每一步的"局部不确定性 ( U_n )"与"情境权重 ( W_n )"结合,通过SAUP聚合函数(例如加权平均、加权熵融合等),得到智能体的整体不确定性 ( U_{agent} )
  • return Situational Awareness Agent Uncertainty U_{agent}
    • 输出最终的"情境感知智能体不确定性",用于评估智能体对当前情境的感知可靠性。

三、算法核心设计的意义

  1. 解决"情境权重难精确获取"的痛点:通过"基于距离的替代方法"(CHMM或朴素距离),绕开"精确情境权重无法实际获取"的问题,用"语义/逻辑偏离程度"间接量化权重,实现可落地的不确定性估计。
  2. 分层量化不确定性:先算"步骤级局部不确定性",再结合"情境权重"算"智能体级整体不确定性",让不确定性估计从"单一维度"升级为"考虑情境关联的多维度",更贴合真实推理场景。

简单来说,SAUP算法是一套"先拆步量化局部不确定性、再按情境距离分配权重、最后聚合得到整体不确定性"的流程,核心价值是让智能体的不确定性估计更贴合"推理情境",从而提升评估的可靠性~

相关推荐
会员源码网13 小时前
使用`mysql_*`废弃函数(PHP7+完全移除,导致代码无法运行)
后端·算法
木心月转码ing14 小时前
Hot100-Day10-T438T438找到字符串中所有字母异位词
算法
HelloReader15 小时前
Wi-Fi CSI 感知技术用无线信号“看见“室内的人
算法
颜酱17 小时前
二叉树分解问题思路解题模式
javascript·后端·算法
qianpeng89719 小时前
水声匹配场定位原理及实验
算法
董董灿是个攻城狮1 天前
AI视觉连载8:传统 CV 之边缘检测
算法
AI软著研究员2 天前
程序员必看:软著不是“面子工程”,是代码的“法律保险”
算法
FunnySaltyFish2 天前
什么?Compose 把 GapBuffer 换成了 LinkBuffer?
算法·kotlin·android jetpack
颜酱2 天前
理解二叉树最近公共祖先(LCA):从基础到变种解析
javascript·后端·算法
地平线开发者2 天前
SparseDrive 模型导出与性能优化实战
算法·自动驾驶