文章目录
- 前言
- [5.5.1 勒让德变换](#5.5.1 勒让德变换)
- [5.5.2 正则方程](#5.5.2 正则方程)
- [5.5.3 正则方程-例题](#5.5.3 正则方程-例题)
- [5.5.4 相空间](#5.5.4 相空间)
- 参考资料
前言
内容概括: 本文介绍了勒让德变换及其在哈密顿力学中的应用。勒让德变换通过将函数自变量从坐标转换为斜率,成为连接拉格朗日力学和哈密顿力学的关键工具。在哈密顿力学中,通过勒让德变换将广义速度替换为广义动量,推导出哈密顿正则方程,将二阶微分方程转化为一阶方程组。此外,还引入了 2 s 2s 2s维相空间的概念,指出哈密顿力学相比拉格朗日力学在求解运动积分方面的潜在优势,并讨论了拉格朗日函数不唯一性对构建相空间的重要意义。
5.5.1 勒让德变换
在介绍哈密顿力学之前,我们先来补充一些数学知识------勒让德变换。
在物理学中,它是连接拉格朗日力学和哈密顿力学的桥梁,也是热力学中变换各种势能(如内能变焓能)的核心数学工具。
简单来说,勒让德变换的作用是:将一个函数自变量从 "坐标" 切换到 "斜率"。
有函数 F = F ( x 1 , ... , x n ) F = F(x_1, \dots, x_n) F=F(x1,...,xn),自变量 x 1 , ... , x n x_1, \dots, x_n x1,...,xn都是独立变量。 F F F的全微分为
d F = ∑ i = 1 n ∂ F ∂ x i d x i dF = \sum_{i=1}^{n} \frac{\partial F}{\partial x_i} dx_i dF=i=1∑n∂xi∂Fdxi
引入新变量 u i = ∂ F ∂ x i u_i = \frac{\partial F}{\partial x_i} ui=∂xi∂F,在几何上, u i u_i ui 就是函数 F F F 在 x i x_i xi 方向上的斜率 。 F F F 的微分可以写成
d F = ∑ i = 1 n u i d x i dF = \sum_{i=1}^{n} u_i dx_i dF=i=1∑nuidxi
这里的 u i u_i ui 是 x i x_i xi 的函数,即 u i = u i ( x 1 , ... , x n ) u_i = u_i(x_1, \dots, x_n) ui=ui(x1,...,xn)。
若雅克比行列式 ∣ ∂ ( u 1 , ... , u n ) ∂ ( x 1 , ... , x n ) ∣ ≠ 0 \left| \frac{\partial(u_1, \dots, u_n)}{\partial(x_1, \dots, x_n)} \right| \neq 0 ∂(x1,...,xn)∂(u1,...,un) =0,它保证了 x x x 和 u u u 之间有一一对应的关系。则 u 1 , ... , u n u_1, \dots, u_n u1,...,un 也是独立变量。
构造新函数
G = G ( u 1 , ... , u n ) = ∑ i = 1 n x i u i − F G = G(u_1, \dots, u_n) = \sum_{i=1}^{n} x_i u_i - F G=G(u1,...,un)=i=1∑nxiui−F
那么
d G = d ( ∑ i = 1 n x i u i ) − d F = ( ∑ i = 1 n x i d u i + ∑ i = 1 n u i d x i ) − ( ∑ i = 1 n u i d x i ) = ∑ i = 1 n x i d u i \begin{aligned} dG &= d(\sum_{i=1}^{n} x_i u_i) - dF \\ &= (\sum_{i=1}^{n} x_i du_i + \color{red}{\sum_{i=1}^{n} u_i dx_i}) - (\color{red}{\sum_{i=1}^{n} u_i dx_i})\\ &=\sum_{i=1}^{n} x_i du_i \end{aligned} dG=d(i=1∑nxiui)−dF=(i=1∑nxidui+i=1∑nuidxi)−(i=1∑nuidxi)=i=1∑nxidui
又由于G 的微分为
d G = ∑ i = 1 n ∂ G ∂ u i d u i dG = \sum_{i=1}^{n} \frac{\partial G}{\partial u_i} du_i dG=i=1∑n∂ui∂Gdui
结合上式得
x i = ∂ G ∂ u i x_i=\frac{\partial G}{\partial u_i} xi=∂ui∂G
综上
{ u i = ∂ F ∂ x i x i = ∂ G ∂ u i \begin{cases} u_i = \dfrac{\partial F}{\partial x_i} \\[1em] x_i = \dfrac{\partial G}{\partial u_i} \end{cases} ⎩ ⎨ ⎧ui=∂xi∂Fxi=∂ui∂G
F = F ( x 1 , ... , x n ) , G = G ( u 1 , ... , u n ) F = F(x_1, \dots, x_n), \quad G = G(u_1, \dots, u_n) F=F(x1,...,xn),G=G(u1,...,un)
F + G = ∑ i x i u i F + G = \sum_i x_i u_i F+G=i∑xiui
这就是勒让德变换。
推广形式: F = F ( x 1 , ... , x n ; y 1 , ... , y m ) F = F(x_1, \dots, x_n; y_1, \dots, y_m) F=F(x1,...,xn;y1,...,ym), u i = ∂ F ∂ x i u_i = \frac{\partial F}{\partial x_i} ui=∂xi∂F
构造 G = G ( u 1 , ... , u n ; y 1 , ... , y m ) = ∑ i = 1 n x i u i − F G = G(u_1, \dots, u_n; y_1, \dots, y_m) = \sum_{i=1}^{n} x_i u_i - F G=G(u1,...,un;y1,...,ym)=∑i=1nxiui−F
加了变量 y y y,但这些 y y y 并没有真正参与变换,有:
{ u i = ∂ F ∂ x i x i = ∂ G ∂ u i \begin{cases} u_i = \dfrac{\partial F}{\partial x_i} \\ x_i = \dfrac{\partial G}{\partial u_i} \end{cases} ⎩ ⎨ ⎧ui=∂xi∂Fxi=∂ui∂G
∂ F ∂ y i = − ∂ G ∂ y i \frac{\partial F}{\partial y_i} = -\frac{\partial G}{\partial y_i} ∂yi∂F=−∂yi∂G
5.5.2 正则方程
哈密顿函数
我们再来看一下拉格朗日方程:
d d t ( ∂ L ∂ q ˙ α ) = ∂ L ∂ q α ( 二阶微分方程 ) \frac{\mathrm{d}}{\mathrm{d}t}\left(\frac{\partial L}{\partial \dot{q}\alpha}\right) = \frac{\partial L}{\partial q\alpha} \quad (\text{二阶微分方程}) dtd(∂q˙α∂L)=∂qα∂L(二阶微分方程)
L = L ( q 1 , q 2 , ... , q s ; q ˙ 1 , q ˙ 2 , ... , q ˙ s ; t ) L = L(q_1, q_2, \dots, q_s; \dot{q}_1, \dot{q}_2, \dots, \dot{q}_s; t) L=L(q1,q2,...,qs;q˙1,q˙2,...,q˙s;t)
拉格朗日函数是关于广义坐标、广义速度和时间的函数。由于广义速度是对时间的一次导数,那么 d d t ( ∂ L ∂ q ˙ α ) \displaystyle \frac{\mathrm{d}}{\mathrm{d}t}\left(\frac{\partial L}{\partial \dot{q}_\alpha}\right) dtd(∂q˙α∂L) 其实就是对时间的二次导数。
由于解二阶微分方程相对复杂,将其中的广义速度替换成广义动量 p α = ∂ L ∂ q ˙ α \displaystyle p_\alpha = \frac{\partial L}{\partial \dot{q}\alpha} pα=∂q˙α∂L,写成
H = H ( q 1 , q 2 , ... , q s ; p 1 , p 2 , ... , p s ; t ) = ∑ α s ∂ L ∂ q ˙ α q ˙ α − L = ∑ α p α q ˙ α − L \begin{aligned} H &= H(q_1, q_2, \dots, q_s; p_1, p_2, \dots, p_s; t) \\ &= \sum\alpha^s \frac{\partial L}{\partial \dot{q}\alpha}\dot{q}\alpha - L\\ &= \sum_\alpha p_\alpha \dot{q}_\alpha - L \end{aligned} H=H(q1,q2,...,qs;p1,p2,...,ps;t)=α∑s∂q˙α∂Lq˙α−L=α∑pαq˙α−L
这个函数 H H H 就是哈密顿函数。
引入勒让德变换
在勒让德变换中,此处把 L L L 当成 F F F, H H H 当成 G G G,广义速度 q ˙ α \dot{q}\alpha q˙α当成 x i x_i xi,广义动量 p α \displaystyle p\alpha pα 当成 u i u_i ui。
F = F ( x 1 , ... , x n ; y 1 , ... , y m ) F = F(x_1, \dots, x_n; y_1, \dots, y_m) F=F(x1,...,xn;y1,...,ym), u i = ∂ F ∂ x i u_i = \frac{\partial F}{\partial x_i} ui=∂xi∂F
构造 G = G ( u 1 , ... , u n ; y 1 , ... , y m ) = ∑ i = 1 n x i u i − F G = G(u_1, \dots, u_n; y_1, \dots, y_m) = \sum_{i=1}^{n} x_i u_i - F G=G(u1,...,un;y1,...,ym)=∑i=1nxiui−F
将广义动量公式 p α = ∂ L ∂ q ˙ α \displaystyle p_\alpha = \frac{\partial L}{\partial \dot{q}\alpha} pα=∂q˙α∂L 进行勒让德变换,可以得到广义速度
q ˙ α = ∂ H ∂ p α \boxed{\dot{q}\alpha = \frac{\partial H}{\partial p_\alpha}} q˙α=∂pα∂H
广义坐标没有参与变换,所以
∂ L ∂ q α = − ∂ H ∂ q α \frac{\partial L}{\partial q_\alpha} = -\frac{\partial H}{\partial q_\alpha} ∂qα∂L=−∂qα∂H
又由于,将广义动量代入拉格朗日方程,可以得到
d d t p α = ∂ L ∂ q α \frac{\mathrm{d}}{\mathrm{d}t} p_\alpha = \frac{\partial L}{\partial q_\alpha} dtdpα=∂qα∂L
结合上面式子,可以得到广义动量对时间的导数,等于哈密顿量对广义坐标的偏导前面加个负号:
p ˙ α = − ∂ H ∂ q α \boxed{\dot{p}\alpha = -\frac{\partial H}{\partial q\alpha}} p˙α=−∂qα∂H
将框起来的两个公式组合在一起,就得到了新的动力学方程,也就是哈密顿正则方程:
{ q ˙ α = ∂ H ∂ p α p ˙ α = − ∂ H ∂ q α α = 1 , 2 , ... , s \begin{cases} \dot{q}{\alpha} = \dfrac{\partial H}{\partial p{\alpha}} \\[1em] \dot{p}{\alpha} = -\dfrac{\partial H}{\partial q{\alpha}} \end{cases} \quad \alpha = 1, 2, \dots, s ⎩ ⎨ ⎧q˙α=∂pα∂Hp˙α=−∂qα∂Hα=1,2,...,s
5.5.3 正则方程-例题
一顿操作猛如虎,使用哈密顿正则方程解题最终回归到了拉格朗日方程。怎么摆脱这个困扰,请听后续分解。
5.5.4 相空间
哈密顿函数 H = H ( q 1 , q 2 , ... , q s ; p 1 , p 2 , ... , p s ; t ) H = H(q_1, q_2, \dots, q_s; p_1, p_2, \dots, p_s; t) H=H(q1,q2,...,qs;p1,p2,...,ps;t) 是关于广义坐标、广义动量和时间的函数。
其中 s s s 个广义坐标和 s s s 个广义动量,这 2 s 2s 2s 个变量所张成的 2 s 2s 2s 维空间,被称为相空间。
目前所学的哈密顿力学 ,相比拉格朗日力学,暂时看不出明显优势。而哈密顿力学正是从相空间出发,才摆脱这一尴尬处境。
回顾拉格朗日力学:它建立在 s s s 维位形空间 中,最多只能得到 s s s 个运动积分。即便找到全部 s s s 个积分,仍需再解 s s s 个一阶微分方程,求解难度依然很大。
若引入 2s 维相空间 ,新力学体系理论上最多可得到 2s 个运动积分 。理想情况下,这能避免直接求解微分方程。
但问题在于:要让相空间真正成立,坐标 q q q 与动量 p p p 必须能构成更高维空间,这看似存在困难。按定义,广义动量 p = ∂ L ∂ q ˙ p = \dfrac{\partial L}{\partial \dot q} p=∂q˙∂L,给定坐标就对应速度,再唯一对应动量,和牛顿力学一样, q q q 与 p p p 是一一对应的。
就像平面中若 x = y x=y x=y,二维就退化为一维直线;同理,若 q q q 与 p p p 严格一一对应,相空间仍会退化为 s s s 维位形空间。
为解决这一问题,需要从拉格朗日函数 L L L 入手:
如果允许 L L L 不唯一、可以取无穷多种形式, q q q 与 p p p 就不再严格一一对应,相空间才能真正成为 2s 维空间。
我们习惯 L = T − V L=T-V L=T−V,并用它解决了大量问题。但 L = T − V L=T-V L=T−V 只是一种正确形式,不是唯一形式。
对于任意函数 f f f,定义和及其对时间的导数如下:
∀ f = f ( q 1 , ... , q s , t ) ⟹ f ˙ = ∂ f ∂ t + ∑ β = 1 s ∂ f ∂ q β q ˙ β \forall f = f(q_1, \dots, q_s, t) \implies \dot{f} = \frac{\partial f}{\partial t} + \sum_{\beta=1}^{s} \frac{\partial f}{\partial q_\beta} \dot{q}_\beta ∀f=f(q1,...,qs,t)⟹f˙=∂t∂f+β=1∑s∂qβ∂fq˙β
该导数再对广义速度求一次偏导, f f f 对时间偏导不会显含速度,所以第一项为 0,第二项只有当 β = α \beta=\alpha β=α 时才不为 0,所以结果为:
⟹ ∂ f ˙ ∂ q ˙ α = ∂ ∂ q ˙ α ( ∂ f ∂ t + ∑ β = 1 s ∂ f ∂ q β q ˙ β ) = 0 + ∂ f ∂ q α \implies \frac{\partial \dot{f}}{\partial \dot{q}\alpha} = \frac{\partial}{\partial \dot{q}\alpha}\left(\frac{\partial f}{\partial t} + \sum_{\beta=1}^{s} \frac{\partial f}{\partial q_\beta} \dot{q}\beta\right) = 0 + \frac{\partial f}{\partial q\alpha} ⟹∂q˙α∂f˙=∂q˙α∂ ∂t∂f+β=1∑s∂qβ∂fq˙β =0+∂qα∂f
我们继续把该结果对时间求偏导:
⟹ d d t ( ∂ f ˙ ∂ q ˙ α ) = d d t ( ∂ f ∂ q α ) = ∂ 2 f ∂ t ∂ q α + ∑ β = 1 s ∂ 2 f ∂ q α ∂ q β q ˙ β (1) \implies \frac{\mathrm{d}}{\mathrm{d}t}\left(\frac{\partial \dot{f}}{\partial \dot{q}\alpha}\right) = \frac{\mathrm{d}}{\mathrm{d}t}\left(\frac{\partial f}{\partial q\alpha}\right) = \frac{\partial^2 f}{\partial t \partial q_\alpha} + \sum_{\beta=1}^{s} \frac{\partial^2 f}{\partial q_\alpha \partial q_\beta} \dot{q}_\beta \tag{1} ⟹dtd(∂q˙α∂f˙)=dtd(∂qα∂f)=∂t∂qα∂2f+β=1∑s∂qα∂qβ∂2fq˙β(1)
由于 f f f是时间 t t t的函数, ∂ f ∂ q α \displaystyle \frac{\partial f}{\partial q_\alpha} ∂qα∂f显含时间 t t t。先对时间求偏导为\\displaystyle \\frac{\\partial\^2 f}{\\partial t \\partial q_\\alpha} ,再对每一个广义坐标求偏导。
假设我们有一个函数 A = ∂ f ∂ q α A = \frac{\partial f}{\partial q_\alpha} A=∂qα∂f。在拉格朗日力学中,这个 A A A 通常不仅显式地依赖于时间 t t t,还依赖于所有的广义坐标 q 1 , q 2 , ... , q s q_1, q_2, \dots, q_s q1,q2,...,qs。由于每一个广义坐标 q β q_\beta qβ 本身又是时间的函数(即 q β = q β ( t ) q_\beta = q_\beta(t) qβ=qβ(t)),所以当你对 A A A 求关于时间 t t t 的全导数时,必须考虑所有坐标变化带来的间接影响: d A d t = ∂ A ∂ t + ∂ A ∂ q 1 d q 1 d t + ∂ A ∂ q 2 d q 2 d t + ⋯ + ∂ A ∂ q s d q s d t \frac{d A}{dt} = \frac{\partial A}{\partial t} + \frac{\partial A}{\partial q_1} \frac{dq_1}{dt} + \frac{\partial A}{\partial q_2} \frac{dq_2}{dt} + \dots + \frac{\partial A}{\partial q_s} \frac{dq_s}{dt} dtdA=∂t∂A+∂q1∂Adtdq1+∂q2∂Adtdq2+⋯+∂qs∂Adtdqs
所以第二项为
∑ β = 1 s ∂ 2 f ∂ q α ∂ q β q ˙ β \sum_{\beta=1}^{s} \frac{\partial^2 f}{\partial q_\alpha \partial q_\beta} \dot{q}_\beta β=1∑s∂qα∂qβ∂2fq˙β
又因为:
∂ f ˙ ∂ q α = ∂ ∂ q α ( ∂ f ∂ t + ∑ β = 1 s ∂ f ∂ q β q ˙ β ) = ∂ 2 f ∂ t ∂ q α + ∑ β = 1 s ∂ 2 f ∂ q α ∂ q β q ˙ β (2) \frac{\partial \dot{f}}{\partial q_\alpha} = \frac{\partial}{\partial q_\alpha}\left(\frac{\partial f}{\partial t} + \sum_{\beta=1}^{s} \frac{\partial f}{\partial q_\beta} \dot{q}\beta\right) = \frac{\partial^2 f}{\partial t \partial q\alpha} + \sum_{\beta=1}^{s} \frac{\partial^2 f}{\partial q_\alpha \partial q_\beta} \dot{q}_\beta \tag{2} ∂qα∂f˙=∂qα∂ ∂t∂f+β=1∑s∂qβ∂fq˙β =∂t∂qα∂2f+β=1∑s∂qα∂qβ∂2fq˙β(2)
我们发现(1)、(2)的结果完全相等!有
d d t ( ∂ f ˙ ∂ q ˙ α ) = ∂ f ˙ ∂ q α \frac{\mathrm{d}}{\mathrm{d}t}\left(\frac{\partial \dot{f}}{\partial \dot{q}\alpha}\right)=\frac{\partial \dot{f}}{\partial q\alpha} dtd(∂q˙α∂f˙)=∂qα∂f˙
而且最终这个形式竟然跟拉格朗日方程是完全一样的!
我们可以得到如下结论:
1、对于 L ′ = L + f ˙ , ∀ f = f ( q 1 , ... , q s , t ) L' = L + \dot{f},\quad \forall f = f(q_1,\dots,q_s,t) L′=L+f˙,∀f=f(q1,...,qs,t) 也符合拉格朗日方程。
证明:将 L ′ = L + f ˙ L' = L + \dot{f} L′=L+f˙代入拉格朗日方程展开得到:
d d t ( ∂ L ∂ q ˙ ) − ∂ L ∂ q \] ⏟ 这是原有的方程 + \[ d d t ( ∂ f ˙ ∂ q ˙ ) − ∂ f ˙ ∂ q \] ⏟ 这是多出来的部分 \\underbrace{\\left\[ \\frac{d}{dt} \\left( \\frac{\\partial L}{\\partial \\dot{q}} \\right) - \\frac{\\partial L}{\\partial q} \\right\]}_{\\text{这是原有的方程}} + \\underbrace{\\left\[ \\frac{d}{dt} \\left( \\frac{\\partial \\dot{f}}{\\partial \\dot{q}} \\right) - \\frac{\\partial \\dot{f}}{\\partial q} \\right\]}_{\\text{这是多出来的部分}} 这是原有的方程 \[dtd(∂q˙∂L)−∂q∂L\]+这是多出来的部分 \[dtd(∂q˙∂f˙)−∂q∂f˙
"多出来的部分"等于 0 。
2、对于任意广义坐标 q α q_\alpha qα 可以根据拉格朗日函数 L L L,得到某一个相对应的广义动量 p α = ∂ L ∂ q ˙ α \displaystyle p_\alpha = \frac{\partial L}{\partial \dot{q}_\alpha} pα=∂q˙α∂L。
但是这个广义动量不是唯一的,我们还可以得到其他的广义动量 p α ′ = ∂ L ′ ∂ q ˙ α = ∂ ( L + f ˙ ) ∂ q ˙ α = p α + ∂ f ˙ ∂ q α ˙ = p α + ∂ f ∂ q α \displaystyle p_\alpha' = \frac{\partial L'}{\partial \dot{q}\alpha}=\frac{\partial (L+ \dot{f})}{\partial \dot{q}\alpha}=p_\alpha+\frac{\partial \dot{f}}{\partial \dot{q_\alpha}}=p_\alpha+\frac{\partial f}{\partial q_\alpha} pα′=∂q˙α∂L′=∂q˙α∂(L+f˙)=pα+∂qα˙∂f˙=pα+∂qα∂f
可以看出,一个广义坐标可以对应无穷多个广义动量,所以广义坐标和广义动量是可以相互独立的,可以张成维度更高的相空间。
在哈密顿函数里,广义坐标也被称为正则坐标 ,广义动量也被称为正则动量,正则坐标和正则动量构成一对对的共轭变量。
参考资料
本文是分析力学学习笔记,主要参考为 哈工大任延宇老师的《理论力学(物理类)》教程 分析力学部分,感谢任老师贡献如此精美的课程。为方便大家对比学习,本文章节按照原教程排版。
- 理论力学(物理类) 主讲:哈尔滨工业大学物理学院 任延宇 https://www.bilibili.com/video/BV1xJ411s78q
- 理论力学(物理类)(分析力学) https://www.bilibili.com/video/BV1hY411g7HG
- 分析力学 WANG LH https://gtbcamp.cn/notes/analytical-mechanics/analytical-mechanics.pdf
- 经典力学 高显