机器人中的数值优化(十九)—— SOCP锥规划应用:时间最优路径参数化(TOPP)

本系列文章主要是我在学习《数值优化》过程中的一些笔记和相关思考,主要的学习资料是深蓝学院的课程《机器人中的数值优化》和高立编著的《数值最优化方法》等,本系列文章篇数较多,不定期更新,上半部分介绍无约束优化,下半部分介绍带约束的优化,中间会穿插一些路径规划方面的应用实例



三十一、时间最优路径参数化(TOPP)

如果我们有一条二阶连续可微的路径q,现在我们想要机器人去跟踪这个路径,需要给这条路径加入时间属性,同时使其满足机器人的动力学约束,路径可由弧长s变量参数化,将路径分割成若干段小路径,我们可以知道每段小路径对应的空间位置,但是缺乏时间属性,TOPP就是在给定的平滑路径 q ( s ) q(s) q(s)上生成时间信息,并使得在满足机器人动力学约束的前提下,路径花费的时间应该尽可能短。

使用弧长参数s来对路径进行参数化,s的值表征的是距离路径起点所走过的路径距离,在下图的例子中,左下角路径的起点处s=0,右上角路径的终点处s=L,L即该路径的总长度,对于该路径,我们可以用 d s d t \frac{\mathrm{d}s}{\mathrm{d}t} dtds来表征路径上某个位置处的速度,它是连续的,如下图中右下角的曲线所示,同理,可以用 d 2 s d t 2 \frac{\mathrm{d}^2s}{\mathrm{d}t^2} dt2d2s来表征路径上某个位置处的加速度,它可以是不连续的,如下图中左上角的曲线所示。

--

现在,我们假设把s拉成直线,对于匀加速运动,起点s=0处的速度为 v 0 v_0 v0,终点s=L处的速度为 v L v_L vL,由基础的物理学公式可知 v L 2 − v 0 2 = 2 a L v_L^2-v_0^2=2aL vL2−v02=2aL,进一步可知:

lim ⁡ L → 0 V L 2 − V 0 2 L = 2 a \operatorname*{lim}{L\rightarrow0}\frac{V{L}^{2}-V_{0}^{2}}{L}=2a L→0limLVL2−V02=2a

也即 d v 2 d s = 2 a \frac{dv^{2}}{ds}=2a dsdv2=2a,我们得到了一个不依赖于时间属性的微分关系,我们以弧长s为参量的话, v 2 v^2 v2与2a是线性的微分关系, v 2 v^2 v2可以用 ( d s d t ) 2 \left(\frac{\mathrm{d}s}{\mathrm{d}t}\right)^2 (dtds)2表示

通过类比以上速度和加速度的概念,我们可以得到

a ( s ) = d 2 s d t 2 , b ( s ) = ( d s d t ) 2 v s 2 − v 0 2 = 2 a s b ′ ( s ) = 2 a ( s ) \begin{gathered}a(s)=\frac{\mathrm{d}^2s}{\mathrm{d}t^2},b(s)=(\frac{\mathrm{d}s}{\mathrm{d}t})^2\\\\v_s^2-v_0^2=2as\\\\b^{\prime}(s)=2a(s)\end{gathered} a(s)=dt2d2s,b(s)=(dtds)2vs2−v02=2asb′(s)=2a(s)

其实,我们想要在一系列的约束下,找一个s与s'的时间最优的轨迹

我们想要整个轨迹在动力学约束下时间最短,也就是最小化总的时间T,由于我们缺乏时间信息,所以,需要进行换元,将对时间的积分转换成对弧长s的积分,如下式所示:

T = ∫ 0 T 1 d t = ∫ s ( 0 ) s ( T ) 1 d s / d t d s = ∫ 0 L 1 d s / d t d s = ∫ 0 L 1 b ( s ) d s T=\int_0^T1\mathrm{~d}t=\int_{s(0)}^{s(T)}\frac1{\mathrm{d}s/\mathrm{d}t}\mathrm{d}s=\int_0^L\frac1{\mathrm{d}s/\mathrm{d}t}\mathrm{d}s=\int_0^L\frac1{\sqrt{b(s)}}\mathrm{d}s T=∫0T1 dt=∫s(0)s(T)ds/dt1ds=∫0Lds/dt1ds=∫0Lb(s) 1ds

利用链式求导法则可以得到真实的速度 d q d t \frac{\mathrm{d}q}{\mathrm{d}t} dtdq和加速度 d 2 q d t 2 \frac{\mathrm{d}^2q}{\mathrm{d}t^2} dt2d2q,分别与 d s d t \frac{\mathrm{d}s}{\mathrm{d}t} dtds、 d 2 s d t 2 \frac{\mathrm{d}^{2}s}{\mathrm{d}t^{2}} dt2d2s的关系,如下所示:

d q d t = q ′ ( s ) d s d t = q ′ ( s ) b ( s ) \frac{\mathrm{d}q}{\mathrm{d}t}=q^{\prime}(s)\frac{\mathrm{d}s}{\mathrm{d}t}=q^{\prime}(s)\sqrt{b(s)} dtdq=q′(s)dtds=q′(s)b(s)

d 2 q d t 2 = q ′ ′ ( s ) ( d s d t ) 2 + q ′ ( s ) d 2 s d t 2 = q ′ ′ ( s ) b ( s ) + q ′ ( s ) a ( s ) \frac{\mathrm{d}^2q}{\mathrm{d}t^2}=q^{\prime\prime}(s){\left(\frac{\mathrm{d}s}{\mathrm{d}t}\right)}^2+q^{\prime}(s)\frac{\mathrm{d}^2s}{\mathrm{d}t^2}=q^{\prime\prime}(s)b(s)+q^{\prime}(s)a(s) dt2d2q=q′′(s)(dtds)2+q′(s)dt2d2s=q′′(s)b(s)+q′(s)a(s)

若我们只考虑向前运动的情况,则b(s)≥0应该严格成立,并仅在某个或某几个瞬间为0.

因此,我们可以将这个简单的TOPP问题表述为:

min ⁡ a ( s ) , b ( s ) ∫ 0 L 1 b ( s ) d s s . t . b ( s ) ≥ 0 , ∀ s ∈ [ 0 , L ] , b ′ ( s ) = 2 a ( s ) , ∀ s ∈ [ 0 , L ] , ∥ q ′ ( s ) b ( s ) ∥ ∞ ≤ v m a x , ∀ s ∈ [ 0 , L ] , ∥ q ′ ′ ( s ) b ( s ) + q ′ ( s ) a ( s ) ∥ ∞ ≤ a m a x , ∀ s ∈ [ 0 , L ] , b ( 0 ) = b 0 , b ( L ) = b L . \begin{aligned} \min_{a(s),b(s)}& \int_0^{\color{blue}{L}}\frac{1}{\sqrt{b(s)}}\mathrm{d}s \\ \mathrm{s.t.}& b(s)\geq0, \forall s\in[0,L], \\ &b^{\prime}(s)=2a(s), \forall s\in[0,L], \\ &\left\|\color{blue}{q^{\prime}(s)}\color{black}\sqrt{b(s)}\right\|\infty\leq\color{blue}{v{max}}, \color{black}\forall s\in[0,L], \\ &\left\|\color{blue}{q^{\prime\prime}(s)\color{black}b(s)+\color{blue}q^{\prime}(s)\color{black}a(s)}\right\|\infty\leq\color{blue}{a{max}},\color{black}\quad\forall s\in[0,L], \\ &b(0)=\color{blue}{b_0},\color{black}~b(L)=\color{blue}{b_L}. \end{aligned} a(s),b(s)mins.t.∫0Lb(s) 1dsb(s)≥0,∀s∈[0,L],b′(s)=2a(s),∀s∈[0,L], q′(s)b(s) ∞≤vmax,∀s∈[0,L],∥q′′(s)b(s)+q′(s)a(s)∥∞≤amax,∀s∈[0,L],b(0)=b0, b(L)=bL.

其中 min ⁡ a ( s ) , b ( s ) ∫ 0 L 1 b ( s ) d s \min_{a(s),b(s)}\int_0^L\frac1{\sqrt{b(s)}}\mathrm{d}s mina(s),b(s)∫0Lb(s) 1ds是我们优化的目标函数,即时间最短, b ( s ) ≥ 0 b(s)\geq0 b(s)≥0用于确保s关于t的变化率的平方是非负的, b ′ ( s ) = 2 a ( s ) b^{\prime}(s)=2a(s) b′(s)=2a(s)是前面推导出其满足的物理关系式, ∥ q ′ ( s ) b ( s ) ∥ ∞ ≤ v m a x \left\|\color{black}{q^{\prime}(s)}\sqrt{b(s)}\right\|\infty\leq\color{black}{v{max}} q′(s)b(s) ∞≤vmax即任意弧长在s处的速度要满足动力学约束,同理 ∥ q ′ ′ ( s ) b ( s ) + q ′ ( s ) a ( s ) ∥ ∞ ≤ a m a x \left\|q^{\prime\prime}(s)b(s)+q^{\prime}(s)a(s)\right\|\infty\leq a{max} ∥q′′(s)b(s)+q′(s)a(s)∥∞≤amax任意弧长在s处的加速度要满足动力学约束, b ( 0 ) = b 0 , b ( L ) = b L b(0)=\color{black}{b_0},b(L)=\color{black}{b_L} b(0)=b0,b(L)=bL是让s对t变化率的平方在开始和结束时的值是我们人为给定的。

此外,上式中的蓝色部分都是已知的常数,我们要求的优化变量是a(s)和b(s)这两个凸函数,也即以函数为优化变量的凸问题。

以函数为优化变量的凸问题,在计算机里面不能处理连续时间的问题,我们需要对其进行离散化,即把路径分割成若干段小路径,在每段小路径上, a i a^i ai是一个常数, b i b^i bi是一个线性的函数,如下图所示

离散化后的数学表达式如下所示:

∫ 0 L 1 b ( s ) d s ⇔ ∑ k = 0 K − 1 2 ( s k + 1 − s k ) b k + 1 + b k b ( s ) ≥ 0 , ∀ s ∈ [ 0 , L ] ⇔ b k ≥ 0 , 0 ≤ k ≤ K b ′ ( s ) = 2 a ( s ) , ∀ s ∈ [ 0 , L ] ⇔ b k + 1 − b k s k + 1 − s k = 2 a k , 0 ≤ k ≤ K ∣ q ′ ( s ) b ( s ) ∥ ∞ ≤ v m a x , ∀ s ∈ [ 0 , L ] ⇔ ∥ q ′ ( s k ) b k ∥ ∞ ≤ v m a x , 0 ≤ k ≤ K ∥ q ′ ′ ( s ) b ( s ) + q ′ ( s ) a ( s ) ∥ ∞ ≤ a m a x , ∀ s ∈ [ 0 , L ] ⇔ ∥ q ′ ′ ( s k ) b k + q ′ ( s k ) a k ∥ ∞ ≤ a m a x , 0 ≤ k ≤ K \begin{aligned} \int_{0}^{L}\frac{1}{\sqrt{b(s)}}\mathrm{d}s& \Leftrightarrow\sum_{k=0}^{K-1}\frac{2(s^{k+1}-s^k)}{\sqrt{b^{k+1}}+\sqrt{b^k}} \\ b(s)\geq0,\forall s\in[0,L]& \Leftrightarrow b^k\geq0,0\leq k\leq K \\ b^{\prime}(s)=2a(s),\forall s\in[0,L]& \Leftrightarrow\frac{b^{k+1}-b^k}{s^{k+1}-s^k}=2a^k,0\leq k\leq K \\ \left|q^{\prime}(s)\sqrt{b(s)}\right\Vert_{\infty}\leq v_{max},\forall s\in[0,L]& \Leftrightarrow\left\|q^{\prime}(s^k)\sqrt{b^k}\right\|\infty\leq v{max},0\leq k\leq K \\ \left\|q^{\prime\prime}(s)b(s)+q^{\prime}(s)a(s)\right\|{\infty}\leq a{max},\forall s\in[0,L]& \Leftrightarrow\left\|q^{\prime\prime}(s^k)b^k+q^{\prime}(s^k)a^k\right\|\infty\leq a{max},0\leq k\leq K \end{aligned} ∫0Lb(s) 1dsb(s)≥0,∀s∈[0,L]b′(s)=2a(s),∀s∈[0,L] q′(s)b(s) ∞≤vmax,∀s∈[0,L]∥q′′(s)b(s)+q′(s)a(s)∥∞≤amax,∀s∈[0,L]⇔k=0∑K−1bk+1 +bk 2(sk+1−sk)⇔bk≥0,0≤k≤K⇔sk+1−skbk+1−bk=2ak,0≤k≤K⇔ q′(sk)bk ∞≤vmax,0≤k≤K⇔ q′′(sk)bk+q′(sk)ak ∞≤amax,0≤k≤K

我们现在已经把以函数为优化变量的凸优化转换成了以离散序列 a 0 a^0 a0 ~ a k − 1 a^{k-1} ak−1、 b 0 b^0 b0 ~ b k − 1 b^{k-1} bk−1为优化变量的优化问题,其约束都是线性的等式或不等式。

min ⁡ a k , b k ∑ k = 0 K − 1 2 ( s k + 1 − s k ) b k + 1 + b k \min_{a^k,b^k}\boxed{\sum_{k=0}^{K-1}\frac{2(s^{k+1}-s^k)}{\sqrt{b^{k+1}}+\sqrt{b^k}}} ak,bkmink=0∑K−1bk+1 +bk 2(sk+1−sk)

b k ≥ 0 , 0 ≤ k ≤ K b k + 1 − b k = 2 ( s k + 1 − s k ) a k , 0 ≤ k ≤ K ∥ q ′ ( s k ) b k ∥ ∞ ≤ v m a x , 0 ≤ k ≤ K ∥ q ′ ′ ( s k ) b k + q ′ ( s k ) a k ∥ ∞ ≤ a m a x , 0 ≤ k ≤ K \begin{aligned}&b^k\geq0,\quad&0\leq k\leq K\\&b^{k+1}-b^k=2(s^{k+1}-s^k)a^k,\quad&0\leq k\leq K\\&\left\|q^{\prime}(s^k)\sqrt{b^k}\right\|\infty\leq v{max},\quad&0\leq k\leq K\\&\left\|q^{\prime\prime}(s^k)b^k+q^{\prime}(s^k)a^k\right\|\infty\leq a{max},\quad&0\leq k\leq K\end{aligned} bk≥0,bk+1−bk=2(sk+1−sk)ak, q′(sk)bk ∞≤vmax, q′′(sk)bk+q′(sk)ak ∞≤amax,0≤k≤K0≤k≤K0≤k≤K0≤k≤K

b ( 0 ) = b 0 , b ( L ) = b L . b(0)=b_0,~b(L)=b_L. b(0)=b0, b(L)=bL.

那么。我们如何将以上问题转化为锥规划问题呢?可以对优化的目标函数进行如下的转换:

至此,我们得到了该问题的SOCP形式如下:

min ⁡ a k , b k , c k , d k ∑ k = 0 K − 1 2 ( s k + 1 − s k ) d k ∥ 2 c k + 1 + c k − d k ∥ 2 ≤ c k + 1 + c k + d k , 0 ≤ k ≤ K − 1 ∥ 2 c k b k − 1 ∥ 2 ≤ b k + 1 , 0 ≤ k ≤ K . \begin{aligned}&\min_{a^k,b^k,c^k,d^k}\sum_{k=0}^{K-1}2(s^{k+1}-s^k)d^k\\&\begin{Vmatrix}2\\c^{k+1}+c^k-d^k\end{Vmatrix}_2\leq c^{k+1}+c^k+d^k,\quad0\leq k\leq K-1\\\\&\left\|\begin{array}{c}2c^k\\b^k-1\end{array}\right\|_2\leq b^k+1,\quad&0\leq k\leq K.\end{aligned} ak,bk,ck,dkmink=0∑K−12(sk+1−sk)dk 2ck+1+ck−dk 2≤ck+1+ck+dk,0≤k≤K−1 2ckbk−1 2≤bk+1,0≤k≤K.

b k ≥ 0 , 0 ≤ k ≤ K b k + 1 − b k = 2 ( s k + 1 − s k ) a k , 0 ≤ k ≤ K ∥ q ′ ( s k ) b k ∥ ∞ ≤ v m a x , 0 ≤ k ≤ K ∥ q ′ ′ ( s k ) b k + q ′ ( s k ) a k ∥ ∞ ≤ a m a x , 0 ≤ k ≤ K \begin{aligned}&b^k\geq0,\quad&0\leq k\leq K\\&b^{k+1}-b^k=2(s^{k+1}-s^k)a^k,\quad&0\leq k\leq K\\&\left\|q^{\prime}(s^k)\sqrt{b^k}\right\|\infty\leq v{max},\quad&0\leq k\leq K\\&\left\|q^{\prime\prime}(s^k)b^k+q^{\prime}(s^k)a^k\right\|\infty\leq a{max},\quad&0\leq k\leq K\end{aligned} bk≥0,bk+1−bk=2(sk+1−sk)ak, q′(sk)bk ∞≤vmax, q′′(sk)bk+q′(sk)ak ∞≤amax,0≤k≤K0≤k≤K0≤k≤K0≤k≤K

b ( 0 ) = b 0 , b ( L ) = b L . b(0)=b_0,~b(L)=b_L. b(0)=b0, b(L)=bL.

--

--

--


参考资料:

1、数值最优化方法(高立 编著)

2、机器人中的数值优化


相关推荐
老艾的AI世界8 小时前
AI翻唱神器,一键用你喜欢的歌手翻唱他人的曲目(附下载链接)
人工智能·深度学习·神经网络·机器学习·ai·ai翻唱·ai唱歌·ai歌曲
DK221518 小时前
机器学习系列----关联分析
人工智能·机器学习
Robot2518 小时前
Figure 02迎重大升级!!人形机器人独角兽[Figure AI]商业化加速
人工智能·机器人·微信公众平台
FreedomLeo18 小时前
Python数据分析NumPy和pandas(四十、Python 中的建模库statsmodels 和 scikit-learn)
python·机器学习·数据分析·scikit-learn·statsmodels·numpy和pandas
风间琉璃""9 小时前
二进制与网络安全的关系
安全·机器学习·网络安全·逆向·二进制
Java Fans9 小时前
梯度提升树(Gradient Boosting Trees)详解
机器学习·集成学习·boosting
谢眠10 小时前
机器学习day6-线性代数2-梯度下降
人工智能·机器学习
sp_fyf_202411 小时前
【大语言模型】ACL2024论文-19 SportsMetrics: 融合文本和数值数据以理解大型语言模型中的信息融合
人工智能·深度学习·神经网络·机器学习·语言模型·自然语言处理
FreeIPCC11 小时前
谈一下开源生态对 AI人工智能大模型的促进作用
大数据·人工智能·机器人·开源
sp_fyf_202413 小时前
【大语言模型】ACL2024论文-18 MINPROMPT:基于图的最小提示数据增强用于少样本问答
人工智能·深度学习·神经网络·目标检测·机器学习·语言模型·自然语言处理