在紧性与下降之间:一个算子族原理的拓扑学叙事之二

在紧性与下降之间:一个算子族原理的拓扑学叙事之二


本文紧接上一篇文章 "在紧性与下降之间:一个算子族原理的拓扑学叙事之一",在看本文之前,请先看前序文章。


验证六:0<p≤10< p \leq 10<p≤1 时,目标函数 ϕ\phiϕ 满足 (ϕ1\phi 1ϕ1)

和项变化 :因 0<p≤10<p\leq 10<p≤1,有 1/p≥11/p\geq 11/p≥1,函数 t↦t1/pt\mapsto t^{1/p}t↦t1/p 在 R+\mathbb{R}_+R+ 上是凸函数 。由 Jensen 不等式:

(xip+xjp2)1/p≤xi+xj2,\left(\frac{x_i^p+x_j^p}{2}\right)^{1/p}\leq\frac{x_i+x_j}{2},(2xip+xjp)1/p≤2xi+xj, 即 xi′+xj′≤xi+xjx_i'+x_j'\leq x_i+x_jxi′+xj′≤xi+xj,故 ΔΣ≤0\Delta_\Sigma\leq 0ΔΣ≤0,等号仅当 xi=xjx_i=x_jxi=xj。

局部乘积倒数变化 :由 AM--GM,

xi′xj′=(xip+xjp2)2/p≥((xipxjp)1/2)2/p=xixj.x_i'x_j'=\left(\frac{x_i^p+x_j^p}{2}\right)^{2/p}\geq\bigl((x_i^p x_j^p)^{1/2}\bigr)^{2/p}=x_i x_j.xi′xj′=(2xip+xjp)2/p≥((xipxjp)1/2)2/p=xixj. 因 t↦t−1t\mapsto t^{-1}t↦t−1 严格递减,故 (xi′xj′)−1≤(xixj)−1(x_i'x_j')^{-1}\leq(x_i x_j)^{-1}(xi′xj′)−1≤(xixj)−1,即 ΔΠ≤0\Delta_\Pi\leq 0ΔΠ≤0,等号仅当 xi=xjx_i=x_jxi=xj。

整体变化 :代入 (1),因 Q−1>0Q^{-1}>0Q−1>0,有

ϕ(x′)−ϕ(x)=ΔΣ+Q−1ΔΠ≤0,\phi(x')-\phi(x)=\Delta_\Sigma+Q^{-1}\Delta_\Pi\leq 0,ϕ(x′)−ϕ(x)=ΔΣ+Q−1ΔΠ≤0, 且等号成立当且仅当 ΔΣ=0\Delta_\Sigma=0ΔΣ=0 且 ΔΠ=0\Delta_\Pi=0ΔΠ=0,即 xi=xjx_i=x_jxi=xj。

因此 (ϕ1\phi 1ϕ1) 对 0<p≤10<p\leq 10<p≤1 严格成立 。 □\square□


验证七:1<p<21< p < 21<p<2 时,目标函数 ϕ\phiϕ 满足 (ϕ1\phi 1ϕ1)

0<p≤10<p\leq 10<p≤1 的证明是分离法 (和项与乘积倒数项各自不增,直接相加);而 1<p<21<p<21<p<2 的证明必须借助积分放缩与极值控制 ,因为和项在 Robin Hood 操作下严格增加,需要证明乘积倒数项的减少量严格压倒它。

以下是 1<p<21<p<21<p<2 的严格证明

设 p∈(1,2)p\in(1,2)p∈(1,2),令 α=1/p∈(1/2,1)\alpha=1/p\in(1/2,1)α=1/p∈(1/2,1)。沿用前述记号:x′=Tijxx'=T_{ij}xx′=Tijx,Q=∏k≠i,jxk>0Q=\prod_{k\neq i,j}x_k>0Q=∏k=i,jxk>0,c=xip+xjp∈(0,1)c=x_i^p+x_j^p\in(0,1)c=xip+xjp∈(0,1),u=xip∈(0,c)u=x_i^p\in(0,c)u=xip∈(0,c)。局部目标函数为

g(u)=uα+(c−u)α+Q−1u−α(c−u)−α.g(u)=u^{\alpha}+(c-u)^{\alpha}+Q^{-1}u^{-\alpha}(c-u)^{-\alpha}.g(u)=uα+(c−u)α+Q−1u−α(c−u)−α. 需证明 g(u)≥g(c/2)g(u)\geq g(c/2)g(u)≥g(c/2),等号仅当 u=c/2u=c/2u=c/2。


第一步:一阶导数的化简

g′(u)=αuα−1−α(c−u)α−1−αQ−1(c−2u)u−α−1(c−u)−α−1.g'(u)=\alpha u^{\alpha-1}-\alpha(c-u)^{\alpha-1}-\alpha Q^{-1}(c-2u)u^{-\alpha-1}(c-u)^{-\alpha-1}.g′(u)=αuα−1−α(c−u)α−1−αQ−1(c−2u)u−α−1(c−u)−α−1. 对 u∈(0,c/2)u\in(0,c/2)u∈(0,c/2),c−2u>0c-2u>0c−2u>0。g′(u)<0g'(u)<0g′(u)<0 等价于

uα−1−(c−u)α−1<Q−1(c−2u)u−α−1(c−u)−α−1.(1)u^{\alpha-1}-(c-u)^{\alpha-1}<Q^{-1}(c-2u)u^{-\alpha-1}(c-u)^{-\alpha-1}. \tag{1}uα−1−(c−u)α−1<Q−1(c−2u)u−α−1(c−u)−α−1.(1)


第二步:积分放缩

令 u=c/2−δu=c/2-\deltau=c/2−δ(δ∈(0,c/2)\delta\in(0,c/2)δ∈(0,c/2)),则 c−u=c/2+δc-u=c/2+\deltac−u=c/2+δ。左边为

(c/2−δ)α−1−(c/2+δ)α−1=∫c/2−δc/2+δ(1−α)tα−2 dt.(c/2-\delta)^{\alpha-1}-(c/2+\delta)^{\alpha-1}=\int_{c/2-\delta}^{c/2+\delta}(1-\alpha)t^{\alpha-2}\,dt.(c/2−δ)α−1−(c/2+δ)α−1=∫c/2−δc/2+δ(1−α)tα−2dt. 被积函数 f(t)=(1−α)tα−2f(t)=(1-\alpha)t^{\alpha-2}f(t)=(1−α)tα−2 满足 f′(t)=(1−α)(α−2)tα−3<0f'(t)=(1-\alpha)(\alpha-2)t^{\alpha-3}<0f′(t)=(1−α)(α−2)tα−3<0(因 1−α>01-\alpha>01−α>0,α−2<0\alpha-2<0α−2<0),故 f(t)f(t)f(t) 在 (0,c)(0,c)(0,c) 上严格递减 。因此

∫c/2−δc/2+δf(t) dt<2δ⋅f(c/2−δ)=2δ(1−α)(c/2−δ)α−2.(2)\int_{c/2-\delta}^{c/2+\delta}f(t)\,dt<2\delta\cdot f(c/2-\delta)=2\delta(1-\alpha)(c/2-\delta)^{\alpha-2}. \tag{2}∫c/2−δc/2+δf(t)dt<2δ⋅f(c/2−δ)=2δ(1−α)(c/2−δ)α−2.(2) 将 (2) 代入 (1),只需证

2δ(1−α)(c/2−δ)α−2≤Q−1(c−2δ)(c/2)2−δ2−α−1.2\delta(1-\alpha)(c/2-\delta)^{\alpha-2}\leq Q^{-1}(c-2\delta)\bigl(c/2)\^2-\\delta\^2\\bigr^{-\alpha-1}.2δ(1−α)(c/2−δ)α−2≤Q−1(c−2δ)(c/2)2−δ2−α−1. 注意 c−2δ=2(c/2−δ)c-2\delta=2(c/2-\delta)c−2δ=2(c/2−δ),令 w=c/2−δ∈(0,c/2)w=c/2-\delta\in(0,c/2)w=c/2−δ∈(0,c/2),则 (c/2)2−δ2=w(c−w)(c/2)^2-\delta^2=w(c-w)(c/2)2−δ2=w(c−w)。约去 222 后等价于

Q−1≥(1−α)wα−2w(c−w)α+1=(1−α)w2α−1(c−w)α+1≡(1−α)H(w).(3)Q^{-1}\geq(1-\alpha)w^{\alpha-2}w(c-w)^{\alpha+1}=(1-\alpha)w^{2\alpha-1}(c-w)^{\alpha+1}\equiv(1-\alpha)H(w). \tag{3}Q−1≥(1−α)wα−2w(c−w)α+1=(1−α)w2α−1(c−w)α+1≡(1−α)H(w).(3)


第三步:H(w)H(w)H(w) 的极值

H(w)=w2α−1(c−w)α+1,w∈(0,c/2).H(w)=w^{2\alpha-1}(c-w)^{\alpha+1},\qquad w\in(0,c/2).H(w)=w2α−1(c−w)α+1,w∈(0,c/2). 求导:

H′(w)=w2α−2(c−w)α(2α−1)(c−w)−(α+1)w=w2α−2(c−w)α(2α−1)c−3αw.H'(w)=w^{2\alpha-2}(c-w)^{\alpha}\bigl(2\\alpha-1)(c-w)-(\\alpha+1)w\\bigr \\ =w^{2\alpha-2}(c-w)^{\alpha}\bigl(2\\alpha-1)c-3\\alpha w\\bigr.H′(w)=w2α−2(c−w)α(2α−1)(c−w)−(α+1)w=w2α−2(c−w)α(2α−1)c−3αw. 因 α∈(1/2,1)\alpha\in(1/2,1)α∈(1/2,1),有 2α−1>02\alpha-1>02α−1>0。令 H′(w)=0H'(w)=0H′(w)=0 得唯一临界点

w∗=(2α−1)c3α.w^*=\frac{(2\alpha-1)c}{3\alpha}.w∗=3α(2α−1)c. 验证 w∗∈(0,c/2)w^*\in(0,c/2)w∗∈(0,c/2):

  • w∗>0w^*>0w∗>0 显然;
  • w∗<c/2  ⟺  2α−13α<12  ⟺  4α−2<3α  ⟺  α<2w^*<c/2\iff\frac{2\alpha-1}{3\alpha}<\frac{1}{2}\iff4\alpha-2<3\alpha\iff\alpha<2w∗<c/2⟺3α2α−1<21⟺4α−2<3α⟺α<2,成立。

又 H(w)→0H(w)\to0H(w)→0(当 w→0+w\to0^+w→0+,因 2α−1>02\alpha-1>02α−1>0),且 H(c/2)=(c/2)3α>0H(c/2)=(c/2)^{3\alpha}>0H(c/2)=(c/2)3α>0。由 H′(w)>0H'(w)>0H′(w)>0 对 w∈(0,w∗)w\in(0,w^*)w∈(0,w∗) 及 H′(w)<0H'(w)<0H′(w)<0 对 w∈(w∗,c/2)w\in(w^*,c/2)w∈(w∗,c/2),知 w∗w^*w∗ 是 H(w)H(w)H(w) 在 (0,c/2)(0,c/2)(0,c/2) 上的唯一全局最大值点

计算最大值:

H(w∗)=((2α−1)c3α)2α−1(c−(2α−1)c3α)α+1=((2α−1)c3α)2α−1((α+1)c3α)α+1=c3α(2α−1)2α−1(α+1)α+1(3α)3α.\begin{aligned} H(w^*)&=\left(\frac{(2\alpha-1)c}{3\alpha}\right)^{2\alpha-1}\left(c-\frac{(2\alpha-1)c}{3\alpha}\right)^{\alpha+1}\\ &=\left(\frac{(2\alpha-1)c}{3\alpha}\right)^{2\alpha-1}\left(\frac{(\alpha+1)c}{3\alpha}\right)^{\alpha+1}\\ &=c^{3\alpha}\frac{(2\alpha-1)^{2\alpha-1}(\alpha+1)^{\alpha+1}}{(3\alpha)^{3\alpha}}. \end{aligned}H(w∗)=(3α(2α−1)c)2α−1(c−3α(2α−1)c)α+1=(3α(2α−1)c)2α−1(3α(α+1)c)α+1=c3α(3α)3α(2α−1)2α−1(α+1)α+1.


第四步:Q−1Q^{-1}Q−1 的下界控制

由 (3),只需证明

Q−1≥(1−α)H(w∗)=(1−α)c3α(2α−1)2α−1(α+1)α+1(3α)3α≡K(α)c3α.(4)Q^{-1}\geq(1-\alpha)H(w^*)=(1-\alpha)c^{3\alpha}\frac{(2\alpha-1)^{2\alpha-1}(\alpha+1)^{\alpha+1}}{(3\alpha)^{3\alpha}}\equiv K(\alpha)c^{3\alpha}. \tag{4}Q−1≥(1−α)H(w∗)=(1−α)c3α(3α)3α(2α−1)2α−1(α+1)α+1≡K(α)c3α.(4)

引理 :K(α)<1K(\alpha)<1K(α)<1 对所有 α∈(1/2,1)\alpha\in(1/2,1)α∈(1/2,1) 严格成立。

证明 :将 K(α)K(\alpha)K(α) 重写为

K(α)=(1−α)(2α−13α)2α−1(α+13α)α+1.K(\alpha)=(1-\alpha)\left(\frac{2\alpha-1}{3\alpha}\right)^{2\alpha-1}\left(\frac{\alpha+1}{3\alpha}\right)^{\alpha+1}.K(α)=(1−α)(3α2α−1)2α−1(3αα+1)α+1.

  • 2α−13α∈(0,1/3)⊂(0,1)\frac{2\alpha-1}{3\alpha}\in(0,1/3)\subset(0,1)3α2α−1∈(0,1/3)⊂(0,1),且指数 2α−1>02\alpha-1>02α−1>0,故 (2α−13α)2α−1<1\left(\frac{2\alpha-1}{3\alpha}\right)^{2\alpha-1}<1(3α2α−1)2α−1<1;
  • α+13α=13+13α∈(2/3,1)\frac{\alpha+1}{3\alpha}=\frac{1}{3}+\frac{1}{3\alpha}\in(2/3,1)3αα+1=31+3α1∈(2/3,1)(当 α∈(1/2,1)\alpha\in(1/2,1)α∈(1/2,1)),且指数 α+1>0\alpha+1>0α+1>0,故 (α+13α)α+1<1\left(\frac{\alpha+1}{3\alpha}\right)^{\alpha+1}<1(3αα+1)α+1<1;
  • 1−α∈(0,1/2)1-\alpha\in(0,1/2)1−α∈(0,1/2)。

因此 K(α)<(1−α)⋅1⋅1=1−α<1K(\alpha)<(1-\alpha)\cdot1\cdot1=1-\alpha<1K(α)<(1−α)⋅1⋅1=1−α<1。 □\square□

情形 A:n=2n=2n=2。

Q=1Q=1Q=1(空乘积),故 Q−1=1Q^{-1}=1Q−1=1。由引理,K(α)c3α<1⋅1=1=Q−1K(\alpha)c^{3\alpha}<1\cdot1=1=Q^{-1}K(α)c3α<1⋅1=1=Q−1,(4) 严格成立。

情形 B:n≥3n\geq 3n≥3。

其余 n−2n-2n−2 个变量满足 ∑k≠i,jxkp=1−c\sum_{k\neq i,j}x_k^p=1-c∑k=i,jxkp=1−c。由 AM--GM,

Q≤(1−cn−2)(n−2)/2⇒Q−1≥(n−21−c)(n−2)/2.Q\leq\left(\frac{1-c}{n-2}\right)^{(n-2)/2}\Rightarrow Q^{-1}\geq\left(\frac{n-2}{1-c}\right)^{(n-2)/2}.Q≤(n−21−c)(n−2)/2⇒Q−1≥(1−cn−2)(n−2)/2. 因 n−2≥1n-2\geq1n−2≥1 且 1−c∈(0,1)1-c\in(0,1)1−c∈(0,1),有 n−21−c>1\frac{n-2}{1-c}>11−cn−2>1,故 Q−1≥(n−21−c)(n−2)/2>1Q^{-1}\geq\left(\frac{n-2}{1-c}\right)^{(n-2)/2}>1Q−1≥(1−cn−2)(n−2)/2>1。而由引理,K(α)c3α<1/2<1<Q−1K(\alpha)c^{3\alpha}<1/2<1<Q^{-1}K(α)c3α<1/2<1<Q−1,(4) 严格成立。


第五步:结论

由 (3) 及第四步,g′(u)<0g'(u)<0g′(u)<0 对所有 u∈(0,c/2)u\in(0,c/2)u∈(0,c/2) 成立。由对称性 g(u)=g(c−u)g(u)=g(c-u)g(u)=g(c−u),g′(u)=−g′(c−u)g'(u)=-g'(c-u)g′(u)=−g′(c−u),故 g′(u)>0g'(u)>0g′(u)>0 对所有 u∈(c/2,c)u\in(c/2,c)u∈(c/2,c) 成立。

因此 ggg 在 (0,c/2)(0,c/2)(0,c/2) 严格递减,在 (c/2,c)(c/2,c)(c/2,c) 严格递增,u=c/2u=c/2u=c/2 是 ggg 在 (0,c)(0,c)(0,c) 上的唯一全局最小值点

这就严格证明了:对 1<p<21<p<21<p<2,任意 x∈Sx\in Sx∈S 及任意 TijT_{ij}Tij,

ϕ(Tijx)≤ϕ(x),\phi(T_{ij}x)\leq\phi(x),ϕ(Tijx)≤ϕ(x), 等号成立当且仅当 xi=xjx_i=x_jxi=xj。故条件 (ϕ1\phi 1ϕ1) 对 1<p<21<p<21<p<2 严格成立 。 □\square□


实际上,当 p>0p>0p>0 时,推论(LpL^pLp 约束下的对称化最优性) 是可以被统一证明的。下面给出一个方法:

推论(LpL^pLp 约束下的对称化最优性)

设 p>0p>0p>0,n≥2n\geq 2n≥2,x1,...,xn>0x_1,\dots,x_n>0x1,...,xn>0,且 ∑k=1nxkp=1\sum_{k=1}^n x_k^p=1∑k=1nxkp=1。则

∑k=1nxk+1∏k=1nxk≥n1−1p+nnp,\sum_{k=1}^n x_k+\frac{1}{\prod_{k=1}^n x_k}\geq n^{1-\frac{1}{p}}+n^{\frac{n}{p}},k=1∑nxk+∏k=1nxk1≥n1−p1+npn, 等号成立当且仅当 x1=⋯=xn=n−1/px_1=\cdots=x_n=n^{-1/p}x1=⋯=xn=n−1/p。

证明(单变量降维法): 令 t=∏k=1nxkn>0t=\sqrtn{\prod_{k=1}^n x_k}>0t=n∏k=1nxk >0。由 AM--GM,∑k=1nxk≥nt\sum_{k=1}^n x_k\geq nt∑k=1nxk≥nt。由约束 ∑k=1nxkp=1\sum_{k=1}^n x_k^p=1∑k=1nxkp=1 及 AM--GM,1≥n(∏xkp)1/n=ntp1\geq n(\prod x_k^p)^{1/n}=nt^p1≥n(∏xkp)1/n=ntp,故 0<t≤n−1/p0<t\leq n^{-1/p}0<t≤n−1/p。目标函数满足

ϕ(x)≥f(t)≡nt+t−n,t∈(0,n−1p].\phi(x)\geq f(t)\equiv nt+t^{-n},\qquad t\in\Bigl(0,n^{-\frac{1}{p}}\Bigr].ϕ(x)≥f(t)≡nt+t−n,t∈(0,n−p1]. 求导 f′(t)=n(1−t−(n+1))f'(t)=n(1-t^{-(n+1)})f′(t)=n(1−t−(n+1))。当 0<t≤n−1/p<10<t\leq n^{-1/p}<10<t≤n−1/p<1(因 p>0p>0p>0),有 tn+1<1t^{n+1}<1tn+1<1,故 f′(t)<0f'(t)<0f′(t)<0。因此 f(t)f(t)f(t) 严格单调递减,最小值在 t=n−1/pt=n^{-1/p}t=n−1/p 处取得:

f(t)≥f(n−1p)=n1−1p+nnp.f(t)\geq f(n^{-\frac{1}{p}})=n^{1-\frac{1}{p}}+n^{\frac{n}{p}}.f(t)≥f(n−p1)=n1−p1+npn. 等号要求两次 AM--GM 同时取等,即 x1=⋯=xn=n−1/px_1=\cdots=x_n=n^{-1/p}x1=⋯=xn=n−1/p。

这个证明对所有 p>0p>0p>0 统一有效 ,不依赖任何局部单调性假设,也不依赖紧算子族下降原理,它是最目前简洁的证明路径。

然而,紧算子族下降原理的价值 在于:它为理解"为什么对称化最优"提供了一种动力学视角 (迭代收敛到不动点),并在 0<p≤20<p\leq 20<p≤2 的情形下给出了相应的构造性下降算法 (每一步 Robin Hood 操作都严格下降),且局部条件 (ϕ1\phi 1ϕ1) 已严格验证。

关于 p>2p>2p>2 的进一步说明:

当 p>2p>2p>2 时,局部目标函数 g(u)g(u)g(u) 在边界附近呈现非凸性 (g′′(u)→−∞g''(u)\to-\inftyg′′(u)→−∞ 当 u→0+u\to 0^+u→0+),导致此前基于凸性控制的论证框架结构性失效。数值实验表明 ,Robin Hood 操作仍使 ϕ\phiϕ 严格下降,且对称点仍为唯一不动点;然而,其局部条件 (ϕ1\phi 1ϕ1) 的严格解析证明 涉及复杂的分析,在本文的上述框架下无法完成。不过换一个证明框架,我们还是能严格验证 p>2p>2p>2 时的情形。


验证八:p>2p>2p>2 时,目标函数 ϕ\phiϕ 满足 (ϕ1\phi 1ϕ1)

下面给出与上面完全不一样的框架来证明该结论,从而完善整个验证,形成逻辑闭环

设 p>2p>2p>2,令 α=1/p∈(0,1/2)\alpha=1/p\in(0,1/2)α=1/p∈(0,1/2)。沿用前述记号:x′=Tijxx'=T_{ij}xx′=Tijx,Q=∏k≠i,jxk>0Q=\prod_{k\neq i,j}x_k>0Q=∏k=i,jxk>0,c=xip+xjp∈(0,1)c=x_i^p+x_j^p\in(0,1)c=xip+xjp∈(0,1),u=xip∈(0,c)u=x_i^p\in(0,c)u=xip∈(0,c)。局部目标函数为

g(u)=uα+(c−u)α+Q−1u(c−u)−α.g(u)=u^{\alpha}+(c-u)^{\alpha}+Q^{-1}u(c-u)^{-\alpha}.g(u)=uα+(c−u)α+Q−1u(c−u)−α. 需证明 g(u)≥g(c/2)g(u)\geq g(c/2)g(u)≥g(c/2),等号仅当 u=c/2u=c/2u=c/2。


第一步:一阶导数的零点方程

g′(u)=αuα−1−α(c−u)α−1−αQ−1(c−2u)u−α−1(c−u)−α−1.g'(u)=\alpha u^{\alpha-1}-\alpha(c-u)^{\alpha-1}-\alpha Q^{-1}(c-2u)u^{-\alpha-1}(c-u)^{-\alpha-1}.g′(u)=αuα−1−α(c−u)α−1−αQ−1(c−2u)u−α−1(c−u)−α−1. 对 u∈(0,c/2)u\in(0,c/2)u∈(0,c/2),c−2u>0c-2u>0c−2u>0。g′(u)=0g'(u)=0g′(u)=0 等价于

uα−1−(c−u)α−1=Q−1(c−2u)u−α−1(c−u)−α−1.(1)u^{\alpha-1}-(c-u)^{\alpha-1}=Q^{-1}(c-2u)u^{-\alpha-1}(c-u)^{-\alpha-1}. \tag{1}uα−1−(c−u)α−1=Q−1(c−2u)u−α−1(c−u)−α−1.(1) 令 t=uc−u∈(0,1)t=\dfrac{u}{c-u}\in(0,1)t=c−uu∈(0,1),则 u=ct1+tu=\dfrac{ct}{1+t}u=1+tct,c−u=c1+tc-u=\dfrac{c}{1+t}c−u=1+tc。代入 (1):

左边化简:

uα−1−(c−u)α−1=(ct1+t)α−1−(c1+t)α−1=cα−1(1+t)1−α(tα−1−1).u^{\alpha-1}-(c-u)^{\alpha-1}=\left(\frac{ct}{1+t}\right)^{\alpha-1}-\left(\frac{c}{1+t}\right)^{\alpha-1}=c^{\alpha-1}(1+t)^{1-\alpha}(t^{\alpha-1}-1).uα−1−(c−u)α−1=(1+tct)α−1−(1+tc)α−1=cα−1(1+t)1−α(tα−1−1). 右边化简:

c−2u=c(1−t)1+t,u−α−1=c−α−1t−α−1(1+t)α+1,(c−u)−α−1=c−α−1(1+t)α+1.c-2u=\frac{c(1-t)}{1+t},\quad u^{-\alpha-1}=c^{-\alpha-1}t^{-\alpha-1}(1+t)^{\alpha+1},\quad (c-u)^{-\alpha-1}=c^{-\alpha-1}(1+t)^{\alpha+1}.c−2u=1+tc(1−t),u−α−1=c−α−1t−α−1(1+t)α+1,(c−u)−α−1=c−α−1(1+t)α+1.

三式相乘得

(c−2u)u−α−1(c−u)−α−1=c−2α−1(1−t)t−α−1(1+t)2α+1.(c-2u)u^{-\alpha-1}(c-u)^{-\alpha-1}=c^{-2\alpha-1}(1-t)t^{-\alpha-1}(1+t)^{2\alpha+1}.(c−2u)u−α−1(c−u)−α−1=c−2α−1(1−t)t−α−1(1+t)2α+1. 将左右两边代入 (1),约去正因子 cα−1c^{\alpha-1}cα−1,得到正确的中间等式:

(1+t)1−α(tα−1−1)=Q−1c−3α(1−t)t−α−1(1+t)2α+1.(2)(1+t)^{1-\alpha}(t^{\alpha-1}-1)=Q^{-1}c^{-3\alpha}(1-t)t^{-\alpha-1}(1+t)^{2\alpha+1}. \tag{2}(1+t)1−α(tα−1−1)=Q−1c−3α(1−t)t−α−1(1+t)2α+1.(2)

整理 (2)。利用 tα−1−1=1−t1−αt1−αt^{\alpha-1}-1=\dfrac{1-t^{1-\alpha}}{t^{1-\alpha}}tα−1−1=t1−α1−t1−α,将方程改写为

(1+t)3α(1−t)t2α(1−t1−α)=Qc3α.\frac{(1+t)^{3\alpha}(1-t)}{t^{2\alpha}(1-t^{1-\alpha})}=Qc^{3\alpha}.t2α(1−t1−α)(1+t)3α(1−t)=Qc3α. 定义

Ψ(t)≡(1+t)3α(1−t)t2α(1−t1−α),t∈(0,1).\Psi(t)\equiv\frac{(1+t)^{3\alpha}(1-t)}{t^{2\alpha}(1-t^{1-\alpha})},\qquad t\in(0,1).Ψ(t)≡t2α(1−t1−α)(1+t)3α(1−t),t∈(0,1). 则临界点方程为

Ψ(t)=Qc3α.(3)\Psi(t)=Qc^{3\alpha}. \tag{3}Ψ(t)=Qc3α.(3)


第二步:Ψ(t)\Psi(t)Ψ(t) 的下界估计

对 t∈(0,1)t\in(0,1)t∈(0,1),因 0<1−α<10<1-\alpha<10<1−α<1 且 t∈(0,1)t\in(0,1)t∈(0,1),有 t1−α>tt^{1-\alpha}>tt1−α>t,从而

1−t1−α<1−t.(4)1-t^{1-\alpha}<1-t. \tag{4}1−t1−α<1−t.(4) 代入 Ψ(t)\Psi(t)Ψ(t) 的定义:

Ψ(t)=(1+t)3α(1−t)t2α(1−t1−α)>(1+t)3α(1−t)t2α(1−t)=(1+t)3αt2α=(1+t)3t2α.(5)\Psi(t)=\frac{(1+t)^{3\alpha}(1-t)}{t^{2\alpha}(1-t^{1-\alpha})}>\frac{(1+t)^{3\alpha}(1-t)}{t^{2\alpha}(1-t)}=\frac{(1+t)^{3\alpha}}{t^{2\alpha}}=\left\\frac{(1+t)\^3}{t\^2}\\right^{\alpha}. \tag{5}Ψ(t)=t2α(1−t1−α)(1+t)3α(1−t)>t2α(1−t)(1+t)3α(1−t)=t2α(1+t)3α=t2(1+t)3α.(5) 对 t>0t>0t>0,由二项式展开:

(1+t)3=1+3t+3t2+t3>t2,(1+t)^3=1+3t+3t^2+t^3>t^2,(1+t)3=1+3t+3t2+t3>t2, 故 (1+t)3t2>1\dfrac{(1+t)^3}{t^2}>1t2(1+t)3>1。又因 α>0\alpha>0α>0,函数 s↦sαs\mapsto s^{\alpha}s↦sα 严格递增,因此

Ψ(t)>(1+t)3t2α>1α=1,∀t∈(0,1).(6)\Psi(t)>\left\\frac{(1+t)\^3}{t\^2}\\right^{\alpha}>1^{\alpha}=1,\qquad\forall t\in(0,1). \tag{6}Ψ(t)>t2(1+t)3α>1α=1,∀t∈(0,1).(6)


第三步:Qc3αQc^{3\alpha}Qc3α 的上界控制

情形 A:n=2n=2n=2。

此时无其他变量,Q=1Q=1Q=1(空乘积约定),c≤1c\leq 1c≤1。故

Qc3α=c3/p≤1.(7)Qc^{3\alpha}=c^{3/p}\leq 1. \tag{7}Qc3α=c3/p≤1.(7)

情形 B:n≥3n\geq 3n≥3。

其余 n−2n-2n−2 个变量满足 ∑k≠i,jxkp=1−c\sum_{k\neq i,j}x_k^p=1-c∑k=i,jxkp=1−c。由 Lagrange 乘子法(或 AM--GM 在 ppp-次幂约束下的标准推广),当所有其余变量相等时乘积最大,故

Q=∏k≠i,jxk≤(1−cn−2)n−2p.(8)Q=\prod_{k\neq i,j}x_k\leq\left(\frac{1-c}{n-2}\right)^{\frac{n-2}{p}}. \tag{8}Q=k=i,j∏xk≤(n−21−c)pn−2.(8) 因此

Qc3α≤c3/p(1−cn−2)n−2p=c3(1−c)n−2(n−2)n−21/p.(9)Qc^{3\alpha}\leq c^{3/p}\left(\frac{1-c}{n-2}\right)^{\frac{n-2}{p}}=\left\\frac{c\^3(1-c)\^{n-2}}{(n-2)\^{n-2}}\\right^{1/p}. \tag{9}Qc3α≤c3/p(n−21−c)pn−2=(n−2)n−2c3(1−c)n−21/p.(9) 令 h(c)=c3(1−c)n−2h(c)=c^3(1-c)^{n-2}h(c)=c3(1−c)n−2,c∈0,1c\in0,1c∈0,1。求导:

h′(c)=3c2(1−c)n−2−(n−2)c3(1−c)n−3=c2(1−c)n−33−(n+1)c.h'(c)=3c^2(1-c)^{n-2}-(n-2)c^3(1-c)^{n-3}=c^2(1-c)^{n-3}\bigl3-(n+1)c\\bigr.h′(c)=3c2(1−c)n−2−(n−2)c3(1−c)n−3=c2(1−c)n−33−(n+1)c. 令 h′(c)=0h'(c)=0h′(c)=0 得唯一内部临界点 c∗=3n+1∈(0,1)c^*=\frac{3}{n+1}\in(0,1)c∗=n+13∈(0,1)。此时

hmax⁡=h(c∗)=(3n+1)3(n−2n+1)n−2=27(n−2)n−2(n+1)n+1.(10)h_{\max}=h(c^*)=\left(\frac{3}{n+1}\right)^3\left(\frac{n-2}{n+1}\right)^{n-2}=\frac{27(n-2)^{n-2}}{(n+1)^{n+1}}. \tag{10}hmax=h(c∗)=(n+13)3(n+1n−2)n−2=(n+1)n+127(n−2)n−2.(10) 由 (9)(10),只需验证

27(n−2)n−2(n+1)n+1≤(n−2)n−2,\frac{27(n-2)^{n-2}}{(n+1)^{n+1}}\leq (n-2)^{n-2},(n+1)n+127(n−2)n−2≤(n−2)n−2, 即

27(n+1)n+1≤1  ⟺  27≤(n+1)n+1.(11)\frac{27}{(n+1)^{n+1}}\leq 1\iff 27\leq(n+1)^{n+1}. \tag{11}(n+1)n+127≤1⟺27≤(n+1)n+1.(11) 对 n=3n=3n=3:(3+1)3+1=44=256≥27(3+1)^{3+1}=4^4=256\geq 27(3+1)3+1=44=256≥27。对 n≥3n\geq 3n≥3,(n+1)n+1(n+1)^{n+1}(n+1)n+1 严格递增,故 (11) 恒成立。因此

Qc3α≤hmax⁡(n−2)n−21/p=27(n+1)n+11/p≤11/p=1.(12)Qc^{3\alpha}\leq\left\\frac{h_{\\max}}{(n-2)\^{n-2}}\\right^{1/p}=\left\\frac{27}{(n+1)\^{n+1}}\\right^{1/p}\leq 1^{1/p}=1. \tag{12}Qc3α≤(n−2)n−2hmax1/p=(n+1)n+1271/p≤11/p=1.(12)

综合 (7)(12):对所有可行 (Q,c)(Q,c)(Q,c),

Qc3α≤1.(13)Qc^{3\alpha}\leq 1. \tag{13}Qc3α≤1.(13)


第四步:零点排斥与导数符号

由 (3)(6)(13):

Ψ(t)>1≥Qc3α,∀t∈(0,1).\Psi(t)>1\geq Qc^{3\alpha},\qquad\forall t\in(0,1).Ψ(t)>1≥Qc3α,∀t∈(0,1). 因此方程 Ψ(t)=Qc3α\Psi(t)=Qc^{3\alpha}Ψ(t)=Qc3α 在 (0,1)(0,1)(0,1) 内无解 ,即 g′(u)=0g'(u)=0g′(u)=0 在 (0,c/2)(0,c/2)(0,c/2) 内无解。

又当 u→0+u\to 0^+u→0+ 时,(1) 左边 ∼uα−1→+∞\sim u^{\alpha-1}\to+\infty∼uα−1→+∞,右边 ∼Q−1c⋅u−α−1→+∞\sim Q^{-1}c\cdot u^{-\alpha-1}\to+\infty∼Q−1c⋅u−α−1→+∞。由 (6) 的严格不等式,实际有 g′(u)→−∞g'(u)\to-\inftyg′(u)→−∞(负项主导)。结合 g′(u)g'(u)g′(u) 在 (0,c/2)(0,c/2)(0,c/2) 上的连续性及无零点,得

g′(u)<0,∀u∈(0,c/2).(14)g'(u)<0,\qquad\forall u\in(0,c/2). \tag{14}g′(u)<0,∀u∈(0,c/2).(14)


第五步:全局最小值

由对称性 g(u)=g(c−u)g(u)=g(c-u)g(u)=g(c−u),g′(u)=−g′(c−u)g'(u)=-g'(c-u)g′(u)=−g′(c−u),故

g′(u)>0,∀u∈(c/2,c).(15)g'(u)>0,\qquad\forall u\in(c/2,c). \tag{15}g′(u)>0,∀u∈(c/2,c).(15) 结合 g′(c/2)=0g'(c/2)=0g′(c/2)=0,(14)(15) 表明 ggg 在 (0,c/2)(0,c/2)(0,c/2) 严格递减,在 (c/2,c)(c/2,c)(c/2,c) 严格递增。因此 u=c/2u=c/2u=c/2 是 ggg 在 (0,c)(0,c)(0,c) 上的唯一全局最小值点

这就严格证明了:对 p>2p>2p>2,任意 x∈Sx\in Sx∈S 及任意 TijT_{ij}Tij,

ϕ(Tijx)≤ϕ(x),\phi(T_{ij}x)\leq\phi(x),ϕ(Tijx)≤ϕ(x), 等号成立当且仅当 xi=xjx_i=x_jxi=xj。条件 (ϕ1\phi 1ϕ1) 对 p>2p>2p>2 严格成立 。 □\square□


最终统一结论

至此,所有 p>0p>0p>0 的情形均已严格验证

ppp 的范围 方法 状态
0<p≤10<p\leq 10<p≤1 分离法(凸性) 已验证成立
1<p<21<p<21<p<2 积分放缩 + H(w)H(w)H(w) 极值 已验证成立
p=2p=2p=2 导数分析 + AM-GM 已验证成立
p>2p>2p>2 Ψ(t)\Psi(t)Ψ(t) 下界估计 + 幂平均上界 已验证成立

从而,紧算子族下降原理的局部条件 (ϕ1\phi 1ϕ1) 对全部 p>0p>0p>0 成立,推论(LpL^pLp 约束下的对称化最优性) 可由该原理直接推出,无需任何外部方法。


验证九:结论

综合验证一至八,对于p>0p > 0p>0,紧算子族下降原理的所有假设均已严格验证,从而:

推论(p=2p=2p=2 时的对称化最优性------通过紧算子族下降原理)

设 n≥2n\geq 2n≥2,x1,...,xn>0x_1,\dots,x_n>0x1,...,xn>0,且 ∑k=1nxk2=1\sum_{k=1}^n x_k^2=1∑k=1nxk2=1。则

∑k=1nxk+1∏k=1nxk≥n+nn/2,\sum_{k=1}^n x_k+\frac{1}{\prod_{k=1}^n x_k}\geq \sqrt{n}+n^{n/2},k=1∑nxk+∏k=1nxk1≥n +nn/2, 等号成立当且仅当 x1=⋯=xn=1nx_1=\cdots=x_n=\frac{1}{\sqrt{n}}x1=⋯=xn=n 1。

当 n=4n=4n=4 时,min⁡=2+16=18\min=2+16=18min=2+16=18,这便是开头的那个不等式。

对于一般的 p>0p>0p>0 ,我们有结论:

∑k=1nxk+1∏k=1nxk≥n1−1p+nnp.\sum_{k=1}^n x_k+\frac{1}{\prod_{k=1}^n x_k}\geq n^{1-\frac{1}{p}}+n^{\frac{n}{p}}.k=1∑nxk+∏k=1nxk1≥n1−p1+npn. 这已由单变量降维法严格确立。与此同时,紧算子族下降原理 的局部条件 ($\phi1)现已对全部 p>0p>0p>0 完成验证------其中 0<p≤10<p≤10<p≤1 直接由凸性可得,1<p≤21<p≤21<p≤2 通过积分放缩与导数分析完成,p>2p>2p>2 则通过 Ψ(t)Ψ(t)Ψ(t) 下界估计与幂平均上界控制完成。因此,该原理不仅为这一不等式提供了统一的抽象框架,而且其迭代下降路径在所有 p>0p>0p>0 的情形下均严格可行。


第七部分:反思------数学的抽象化是一场诚实的剥离

写到这里,我想停下来,谈谈这篇长文背后的数学哲学。

十几年前,当我第一次读到 Hardy、Littlewood 和 Pólya 的《不等式》时,我被 Majorization 理论的力量震撼了:Karamata 不等式、Schur-凸性、Robin Hood 变换------这些工具像一台重型机床,能处理成吨的不等式。但我也感到一种困惑:为什么每个定理都要带着置换群 Sn\mathfrak{S}_nSn?为什么对称性必须被写进公理?

多年后我才明白:对称性不是定理的假设,而是应用的装饰。 真正驱动证明的,不是"坐标可以置换",而是"紧空间上有一族算子,它们把一个势函数往下推,直到推到唯一的不动点"。群论只是帮助我们构造这些算子的一种语言------在特定场景下方便使用的语言,而非普遍必要的逻辑前提。

去群化的过程,不是削弱,而是提纯 。就像化学家从矿石中提炼金属,我们从不等式的矿石中提炼出了一个拓扑学原理。这个原理不再关心 a,b,c,da,b,c,da,b,c,d 是否对称,它只关心:

  • 空间 SSS 是否紧?(紧性保证收敛)
  • 算子族 T\mathcal{T}T 是否连续?(连续性保证极限可交换)
  • 势函数 DDD 是否下降?(下降性保证迭代有方向)
  • 不动点 xˉ\bar{x}xˉ 是否唯一?(唯一性保证终点确定)

如果这四个问题的答案是肯定的,那么最小值就在那里,无论你是在做不等式、优化控制、还是统计力学的变分问题。

这让我想起一位老前辈的话:"好的数学定理,应该像一把好刀------切肉时好用,切菜时也好用。如果你只能切一种肉,那不是刀的问题,是你的问题。"

紧算子族下降原理,就是这样一把刀。它不问你切的是什么肉,只问你的砧板是否稳固(紧),你的刀法是否连贯(连续),你的刀刃是否向下(下降),以及你的目标是否唯一(不动点)。当这些条件满足时,下刀之处,即为最小值所在之处。


结语

从一道具体的不等式出发,我们走过了一条漫长的路:经过拓扑学的丛林,跨过函数空间的河流,在紧性与连续性之间搭建桥梁,最终抵达一个简洁而强大的原理。

这条路的终点不是某个特殊的数字,而是一种视角 :当你看到"对称化不增函数值"时,你看到的不再是魔术般的代数技巧,而是紧空间上下降迭代的必然收敛。这种视角一旦获得,你就再也不会以同样的方式看待不等式了。

数学的美,往往不在于最复杂的构造,而在于最简洁的抽象。愿这篇长文,能为你的旅途点亮一盏小灯。