穆勒矩阵（Mueller Matrix）完全指南——从数学推导到工程应用

穆勒矩阵（Mueller Matrix）完全指南------从数学推导到工程应用

知识来源声明： 本文综合整理自以下资料，并在其基础上进行了大量中文改写、公式推导补充和通俗化解释：

Axometrics, Inc. --- Understanding the Mueller Matrix（穆勒矩阵概念、极分解、约化参数、应用场景）

FiberOptics4Sale --- Mueller Matrices for Polarizing Elements（各类偏振元件的穆勒矩阵详细推导）

文中部分图片引用自上述来源

从一个简单的问题开始
斯托克斯矢量------偏振态的数学画像
穆勒矩阵的基本概念
常见偏振元件的穆勒矩阵（重点）
多个元件的级联------顺序很重要
看不懂矩阵怎么办？------极分解与约化参数
- 6.1 [Lu-Chipman 极分解](#Lu-Chipman 极分解)
- 6.2 五大类约化参数详解
工程应用场景
总结：一张图理清全部逻辑

一、从一个简单的问题开始

想象这样一个场景：你有一束激光，它经过了一个不知道什么性质的光学元件，出来的光"变了"。你该如何精确、完整地描述这个元件的偏振特性？

答案就是用穆勒矩阵（Mueller Matrix）。

穆勒矩阵是偏振光学中最重要的数学工具之一，它用一个 4×4 的实数矩阵，完整地描述了一个光学元件（或样品）对光偏振状态的所有影响。不管你关心的是偏振片的效率、波片的延迟量、还是生物组织的散射退偏------这些信息全部编码在穆勒矩阵的 16 个数字之中。

本文的目标是：带你从斯托克斯矢量的定义出发，经过具体偏振元件的矩阵推导，再到极分解和约化参数的提取，最后到工程应用，建立对穆勒矩阵的完整理解。

二、斯托克斯矢量------偏振态的数学画像

在理解穆勒矩阵之前，必须理解它操作的"对象"------斯托克斯矢量。

2.1 为什么需要斯托克斯矢量？

描述光的偏振态，在历史上经历过几个阶段：

最初，人们用琼斯矢量 （Jones Vector），一个 2 元素的复向量，来表示完全偏振光。这很简单，但有一个致命缺陷------无法描述部分偏振光和非偏振光。
1852 年，斯托克斯（G. G. Stokes）提出了用 4 个实数 来描述任意偏振态的方法，这就是斯托克斯矢量。它可以统一处理完全偏振光、部分偏振光、非偏振光。

2.2 数学定义

一束光的斯托克斯矢量是一个 4×1 的列向量：

S = $S 0 S 1 S 2 S 3$ S = \begin{bmatrix} S_0 \\ S_1 \\ S_2 \\ S_3 \end{bmatrix} S= S0S1S2S3

这四个量可以通过光场在两个正交方向（通常取水平 x 和垂直 y）上的复振幅 Eₓ 和 E_y 来计算：

S 0 = E x E x ∗ + E y E y ∗ = I x + I y S 1 = E x E x ∗ − E y E y ∗ = I x − I y S 2 = E x E y ∗ + E y E x ∗ = I + 45 ° − I − 45 ° S 3 = i ( E x E y ∗ − E y E x ∗ ) = I RCP − I LCP \begin{aligned} S_0 &= E_x E_x^* + E_y E_y^* = I_x + I_y \\ $4pt$ S_1 &= E_x E_x^* - E_y E_y^* = I_x - I_y \\ $4pt$ S_2 &= E_x E_y^* + E_y E_x^* = I_{+45°} - I_{-45°} \\ $4pt$ S_3 &= i(E_x E_y^* - E_y E_x^*) = I_{\text{RCP}} - I_{\text{LCP}} \end{aligned} S0S1S2S3=ExEx∗+EyEy∗=Ix+Iy=ExEx∗−EyEy∗=Ix−Iy=ExEy∗+EyEx∗=I+45°−I−45°=i(ExEy∗−EyEx∗)=IRCP−ILCP

注意： 上面式子中的星号 * 表示复共轭，i 是虚数单位。S₃ 的那个 i 不是光强，而是从复振幅运算中自然出现的结果，最终 S₃ 是实数。

2.3 四个分量的物理意义

分量	物理意义	如何测量
S₀	光束的总光强	直接测光功率
S₁	水平线偏振分量减去垂直线偏振分量	先放水平偏振片测 I₀°，再放垂直偏振片测 I₉₀°，S₁ = I₀° − I₉₀°
S₂	+45°线偏振分量减去−45°线偏振分量	放 +45°偏振片测，再放 −45°偏振片测，S₂ = I₄₅° − I₋₄₅°
S₃	右旋圆偏振分量减去左旋圆偏振分量	先放右旋圆偏振片测，再放左旋圆偏振片测，S₃ = I_R − I_L

2.4 几种典型偏振态的斯托克斯矢量

这里列出最常见的几种偏振态，方便后续对照使用。注意我们通常使用归一化的斯托克斯矢量（即 S₀ = 1）：

偏振态	斯托克斯矢量（归一化）	说明
非偏振光（自然光）	$1, 0, 0, 0$ ᵀ	只有总光强，所有偏振分量均为零
水平线偏振	$1, 1, 0, 0$ ᵀ	S₁ = +1，表示电场沿水平方向振动
垂直线偏振	$1, -1, 0, 0$ ᵀ	S₁ = −1，表示电场沿垂直方向振动
+45°线偏振	$1, 0, 1, 0$ ᵀ	S₂ = +1
−45°线偏振	$1, 0, -1, 0$ ᵀ	S₂ = −1
右旋圆偏振（RCP）	$1, 0, 0, 1$ ᵀ	S₃ = +1，从观察者角度看，电场顺时针旋转
左旋圆偏振（LCP）	$1, 0, 0, -1$ ᵀ	S₃ = −1

小技巧： 可以这样记忆------S₁ 管 x/y 方向，S₂ 管 ±45° 方向，S₃ 管圆偏振的左右旋。三个分量互不干扰，构成了偏振态的"三维坐标系"（邦加球）。

2.5 偏振度的概念

对于任意一束光，可以通过前三项来判断其偏振度（Degree of Polarization, DOP）：

DOP = S 1 2 + S 2 2 + S 3 2 S 0 \text{DOP} = \frac{\sqrt{S_1^2 + S_2^2 + S_3^2}}{S_0} DOP=S0S12+S22+S32

DOP = 1：完全偏振光（所有我们上面列举的例子）
DOP = 0：完全非偏振光（自然光）
0 < DOP < 1：部分偏振光（实际光束的常见情况）

为什么 S₁² + S₂² + S₃² ≤ S₀² 总是成立？ 因为每个偏振分量方向上的光强不可能超过总光强，这是物理规律的必然约束。

三、穆勒矩阵的基本概念

3.1 问题的数学表述

有了斯托克斯矢量，我们可以精确描述"入射光是什么"和"出射光是什么"。那么中间的"变换"如何描述？

入射光的斯托克斯矢量：S（4×1 列向量）
出射光的斯托克斯矢量：S′（4×1 列向量）
中间的变换：需要 4×4 = 16 个参数，构成穆勒矩阵 M

3.2 数学形式

穆勒矩阵 M 是一个 4×4 实矩阵，光与材料的相互作用就是一次矩阵乘法：

S ′ = M ⋅ S S' = M \cdot S S′=M⋅S

展开写成：

$S 0 ' S 1 ' S 2 ' S 3 '$ = $m 11 m 12 m 13 m 14 m 21 m 22 m 23 m 24 m 31 m 32 m 33 m 34 m 41 m 42 m 43 m 44$ ⋅ $S 0 S 1 S 2 S 3$ \begin{bmatrix} S'0 \\ S'1 \\ S'2 \\ S'3 \end{bmatrix} =\begin{bmatrix} m{11} & m{12} & m{13} & m{14} \\ m_{21} & m_{22} & m_{23} & m_{24} \\ m_{31} & m_{32} & m_{33} & m_{34} \\ m_{41} & m_{42} & m_{43} & m_{44} \end{bmatrix} \cdot \begin{bmatrix} S_0 \\ S_1 \\ S_2 \\ S_3 \end{bmatrix} S0′S1′S2′S3′ = m11m21m31m41m12m22m32m42m13m23m33m43m14m24m34m44 ⋅ S0S1S2S3

更直观地写成四个线性方程：

S 0 ′ = m 11 S 0 + m 12 S 1 + m 13 S 2 + m 14 S 3 S 1 ′ = m 21 S 0 + m 22 S 1 + m 23 S 2 + m 24 S 3 S 2 ′ = m 31 S 0 + m 32 S 1 + m 33 S 2 + m 34 S 3 S 3 ′ = m 41 S 0 + m 42 S 1 + m 43 S 2 + m 44 S 3 \begin{aligned} S'0 &= m{11}S_0 + m_{12}S_1 + m_{13}S_2 + m_{14}S_3 \\ S'1 &= m{21}S_0 + m_{22}S_1 + m_{23}S_2 + m_{24}S_3 \\ S'2 &= m{31}S_0 + m_{32}S_1 + m_{33}S_2 + m_{34}S_3 \\ S'3 &= m{41}S_0 + m_{42}S_1 + m_{43}S_2 + m_{44}S_3 \end{aligned} S0′S1′S2′S3′=m11S0+m12S1+m13S2+m14S3=m21S0+m22S1+m23S2+m24S3=m31S0+m32S1+m33S2+m34S3=m41S0+m42S1+m43S2+m44S3

这就是穆勒矩阵的核心公式。16 个矩阵元各有含义------比如 m₁₁ 代表"总透过率"，m₂₂ 代表"水平/垂直线偏振的保持能力"，m₄₄ 代表"圆偏振的保持能力"等等。

3.3 穆勒矩阵依赖于测量条件

穆勒矩阵不是一成不变的，它会随以下因素变化：

波长：不同颜色（频率）的光，材料的响应不同。因此完整的特性通常需要光谱扫描。
入射角 ：光以什么角度照射样品，矩阵也不同。对于透镜等曲面元件，需要考虑视场角（Field of View） 的变化。
空间位置 ：对于非均匀样品（如液晶面板的不同区域），需要在不同位置进行测量。

这也就是为什么专业设备（如 AxoScan）要支持多波长、多角度、多点位的自动扫描。

四、常见偏振元件的穆勒矩阵（重点）

这一节是本文的核心内容------我们不再停留在抽象概念，而是直接推导和展示几种最常见偏振元件的穆勒矩阵。理解这些具体矩阵，是后续理解极分解和实际应用的关键。

4.1 线偏振片（Linear Polarizer）的穆勒矩阵

4.1.1 物理模型

偏振片（也叫二向衰减器，diattenuator）对不同方向的光电场分量有不同的衰减。设：

pₓ = 沿 x 方向的振幅衰减系数（0 ≤ pₓ ≤ 1）
p_y = 沿 y 方向的振幅衰减系数（0 ≤ p_y ≤ 1）

出射光和入射光复振幅的关系为：

E x ′ = p x ⋅ E x , E y ′ = p y ⋅ E y E'_x = p_x \cdot E_x, \qquad E'_y = p_y \cdot E_y Ex′=px⋅Ex,Ey′=py⋅Ey

注意区分： pₓ 和 p_y 是振幅衰减系数 （不可直接测量），而 pₓ² 和 p_y² 是光强透过率（可直接测量）。

4.1.2 推导过程（可跳过，直接看结果）

对入射光，斯托克斯参数用复振幅表示为：

S 0 = E x E x ∗ + E y E y ∗ S 1 = E x E x ∗ − E y E y ∗ S 2 = E x E y ∗ + E y E x ∗ S 3 = i ( E x E y ∗ − E y E x ∗ ) \begin{aligned} S_0 &= E_xE_x^* + E_yE_y^* \\ S_1 &= E_xE_x^* - E_yE_y^* \\ S_2 &= E_xE_y^* + E_yE_x^* \\ S_3 &= i(E_xE_y^* - E_yE_x^*) \end{aligned} S0S1S2S3=ExEx∗+EyEy∗=ExEx∗−EyEy∗=ExEy∗+EyEx∗=i(ExEy∗−EyEx∗)

将 Eₓ 换成 pₓEₓ，E_y 换成 p_yE_y，代入出射光的斯托克斯参数中，经过代数运算可得：

S 0 ′ = 1 2 ( p x 2 + p y 2 ) S 0 + 1 2 ( p x 2 − p y 2 ) S 1 S 1 ′ = 1 2 ( p x 2 − p y 2 ) S 0 + 1 2 ( p x 2 + p y 2 ) S 1 S 2 ′ = p x p y ⋅ S 2 S 3 ′ = p x p y ⋅ S 3 \begin{aligned} S'_0 &= \tfrac{1}{2}(p_x^2 + p_y^2)S_0 + \tfrac{1}{2}(p_x^2 - p_y^2)S_1 \\ S'_1 &= \tfrac{1}{2}(p_x^2 - p_y^2)S_0 + \tfrac{1}{2}(p_x^2 + p_y^2)S_1 \\ S'_2 &= p_x p_y \cdot S_2 \\ S'_3 &= p_x p_y \cdot S_3 \end{aligned} S0′S1′S2′S3′=21(px2+py2)S0+21(px2−py2)S1=21(px2−py2)S0+21(px2+py2)S1=pxpy⋅S2=pxpy⋅S3

4.1.3 通用形式

由此得到线偏振片穆勒矩阵的通用形式（以振幅衰减系数 pₓ, p_y 表示）：

M polarizer = 1 2 $p x 2 + p y 2 p x 2 - p y 2 0 0 p x 2 - p y 2 p x 2 + p y 2 0 0 0 0 2 p x p y 0 0 0 0 2 p x p y$ M_{\text{polarizer}} = \frac{1}{2} \begin{bmatrix} p_x^2 + p_y^2 & p_x^2 - p_y^2 & 0 & 0 \\ p_x^2 - p_y^2 & p_x^2 + p_y^2 & 0 & 0 \\ 0 & 0 & 2p_x p_y & 0 \\ 0 & 0 & 0 & 2p_x p_y \end{bmatrix} Mpolarizer=21 px2+py2px2−py200px2−py2px2+py200002pxpy00002pxpy

4.1.4 三角形式

令总透过率 p² = pₓ² + p_y²，并定义角度 γ 使得 pₓ = p·cos γ，p_y = p·sin γ，则矩阵可以写成更优雅的三角形式：

M polarizer = p 2 2 $1 cos 2 γ 0 0 cos 2 γ 1 0 0 0 0 sin 2 γ 0 0 0 0 sin 2 γ$ M_{\text{polarizer}} = \frac{p^2}{2} \begin{bmatrix} 1 & \cos 2\gamma & 0 & 0 \\ \cos 2\gamma & 1 & 0 & 0 \\ 0 & 0 & \sin 2\gamma & 0 \\ 0 & 0 & 0 & \sin 2\gamma \end{bmatrix} Mpolarizer=2p2 1cos2γ00cos2γ10000sin2γ0000sin2γ

参数 γ 的物理含义： 它和偏振片的透过轴方向有关。当 γ = 0° 时（cos 2γ = 1, sin 2γ = 0），为水平偏振片。当 γ = 90° 时（cos 2γ = −1, sin 2γ = 0），为垂直偏振片。

4.1.5 两种极端情况（理想偏振片，p = 1）

理想水平偏振片（γ = 0°）：

M H = 1 2 $1 1 0 0 1 1 0 0 0 0 0 0 0 0 0 0$ M_{\text{H}} = \frac{1}{2} \begin{bmatrix} 1 & 1 & 0 & 0 \\ 1 & 1 & 0 & 0 \\ 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 \end{bmatrix} MH=21 1100110000000000

理想垂直偏振片（γ = 90°）：

M V = 1 2 $1 - 1 0 0 - 1 1 0 0 0 0 0 0 0 0 0 0$ M_{\text{V}} = \frac{1}{2} \begin{bmatrix} 1 & -1 & 0 & 0 \\ -1 & 1 & 0 & 0 \\ 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 \end{bmatrix} MV=21 1−100−110000000000

验证一下： 用非偏振光 $1, 0, 0, 0$ ᵀ 入射到水平偏振片。

S ′ = M H ⋅ $1 0 0 0$ = 1 2 $1 1 0 0$ S' = M_H \cdot \begin{bmatrix}1\\0\\0\\0\end{bmatrix} = \frac{1}{2}\begin{bmatrix}1\\1\\0\\0\end{bmatrix} S′=MH⋅ 1000 =21 1100

结果是水平线偏振光，光强只有原来的一半------因为理想偏振片吸收了垂直分量。✓ 符合物理直觉。

4.2 相位延迟器 / 波片（Phase Shifter / Waveplate / Retarder）的穆勒矩阵

4.2.1 物理模型

波片利用双折射效应，让两个正交偏振分量（沿快轴和慢轴）以不同的速度传播，从而在它们之间引入相位差。

设快轴方向（x 轴）的相位变化为 +φ/2 ，慢轴方向（y 轴）的相位变化为 −φ/2 ，则总的相对相位延迟为 φ。

出射光复振幅为：

E x ′ = E x ⋅ e + i φ / 2 , E y ′ = E y ⋅ e − i φ / 2 E'_x = E_x \cdot e^{+i\varphi/2}, \qquad E'_y = E_y \cdot e^{-i\varphi/2} Ex′=Ex⋅e+iφ/2,Ey′=Ey⋅e−iφ/2

4.2.2 推导与结果

通过类似的代数推导（代入斯托克斯参数的复振幅表达式），得到：

M retarder ( φ ) = $1 0 0 0 0 1 0 0 0 0 cos φ sin φ 0 0 - sin φ cos φ$ M_{\text{retarder}}(\varphi) = \begin{bmatrix} 1 & 0 & 0 & 0 \\ 0 & 1 & 0 & 0 \\ 0 & 0 & \cos\varphi & \sin\varphi \\ 0 & 0 & -\sin\varphi & \cos\varphi \end{bmatrix} Mretarder(φ)= 1000010000cosφ−sinφ00sinφcosφ

矩阵结构解读：

第一行和第一列 $1, 0, 0, 0$ 表示总光强不变（理想波片无吸收），也不与 S₁、S₂、S₃ 交叉耦合。

S₁ 保持不变（m₂₂ = 1），因为延迟发生在 x-y 之间，不影响水平/垂直分量各自的大小。

右下角的 2×2 子矩阵 [[cos φ, sin φ], [−sin φ, cos φ]] 是一个旋转矩阵，表示波片会在 S₂-S₃ 平面内"旋转"偏振态。这正是邦加球上"绕 S₁ 轴旋转 φ 角度"的数学表达。

4.2.3 两种最重要的波片

四分之一波片（Quarter-Wave Plate, QWP），φ = 90° = π/2：

M QWP = $1 0 0 0 0 1 0 0 0 0 0 1 0 0 - 1 0$ M_{\text{QWP}} = \begin{bmatrix} 1 & 0 & 0 & 0 \\ 0 & 1 & 0 & 0 \\ 0 & 0 & 0 & 1 \\ 0 & 0 & -1 & 0 \end{bmatrix} MQWP= 10000100000−10010

QWP 可以将线偏振光转换为圆偏振光，反之亦然。它是偏振光学实验室里最常见的元件之一。

二分之一波片（Half-Wave Plate, HWP），φ = 180° = π：

M HWP = $1 0 0 0 0 1 0 0 0 0 - 1 0 0 0 0 - 1$ M_{\text{HWP}} = \begin{bmatrix} 1 & 0 & 0 & 0 \\ 0 & 1 & 0 & 0 \\ 0 & 0 & -1 & 0 \\ 0 & 0 & 0 & -1 \end{bmatrix} MHWP= 1000010000−10000−1

HWP 可以将水平线偏振光变为垂直线偏振光（反之亦然），相当于将偏振方向"翻转"。

动手算： 用 HWP 作用于 +45° 线偏振光 $1, 0, 1, 0$ ᵀ：

S ′ = M HWP ⋅ $1 0 1 0$ = $1 0 - 1 0$ S' = M_{\text{HWP}} \cdot \begin{bmatrix}1\\0\\1\\0\end{bmatrix} = \begin{bmatrix}1\\0\\-1\\0\end{bmatrix} S′=MHWP⋅ 1010 = 10−10

结果是 −45° 线偏振光。HWP 把偏振方向从 +45° 翻到了 −45°。✓

4.3 偏振旋转器（Polarization Rotator）的穆勒矩阵

4.3.1 物理模型

旋转器直接旋转电场矢量------光纤中的法拉第旋转器就是一个典型例子。它将 x-y 坐标系的电场分量旋转角度 θ：

E x ′ = E x cos ⁡ θ + E y sin ⁡ θ E'_x = E_x \cos\theta + E_y \sin\theta Ex′=Excosθ+Eysinθ

E y ′ = − E x sin ⁡ θ + E y cos ⁡ θ E'_y = -E_x \sin\theta + E_y \cos\theta Ey′=−Exsinθ+Eycosθ

4.3.2 穆勒矩阵

经过推导（特别注意：电场是振幅旋转 θ，但在光强的斯托克斯表示中，角度加倍为 2θ），得到：

M rotator ( θ ) = $1 0 0 0 0 cos 2 θ sin 2 θ 0 0 - sin 2 θ cos 2 θ 0 0 0 0 1$ M_{\text{rotator}}(\theta) = \begin{bmatrix} 1 & 0 & 0 & 0 \\ 0 & \cos 2\theta & \sin 2\theta & 0 \\ 0 & -\sin 2\theta & \cos 2\theta & 0 \\ 0 & 0 & 0 & 1 \end{bmatrix} Mrotator(θ)= 10000cos2θ−sin2θ00sin2θcos2θ00001

关键洞察------为什么是 2θ？

电场旋转角度 θ 是振幅域 的操作（复数域）。而穆勒矩阵描述的是光强域的操作（实数域）。光强和振幅之间有平方关系：I ∝ |E|²。

在邦加球上，S₁ 和 S₂ 表示线偏振的方位角，而邦加球上的方位角恰好等于电场方位角的 2 倍。所以电场旋转 θ，在邦加球上表现为旋转 2θ------这直接反映在矩阵的 sin 2θ 和 cos 2θ 上。

4.3.3 旋转器 vs 波片------不是一回事

初学者容易混淆旋转器和半波片（都能改变偏振方向），但区别很大：

对比维度	旋转器	半波片（HWP）
物理原理	法拉第效应 / 旋光效应 / 液晶扭转	双折射（两个正交分量有相位差）
对线偏振的作用	直接旋转电场方向	将偏振方向关于快轴"镜像翻转"
是否互易	法拉第旋转器非互易（来回方向不变）	波片互易（来回方向相反）
对圆偏振的作用	不影响圆偏振（S₃ 不变）	右旋变左旋，左旋变右旋（S₃ 变号）
穆勒矩阵右下角	`[[cos2θ, sin2θ],[-sin2θ, cos2θ]]` × S₁-S₂	`[[-1,0],[0,-1]]` × S₂-S₃

4.4 旋转任意角度后的穆勒矩阵（极其重要的通用公式）

前面推导的偏振片和波片矩阵，都是假设元件的主轴与实验室坐标轴（x, y）对齐的。但实际光路中，元件往往是旋转过的。

这是工程应用中最常见的需求------也是穆勒矩阵最强大的地方。

4.4.1 三步法推导

设某个元件的本征穆勒矩阵为 M（即主轴与坐标轴对齐时的矩阵），现在将其旋转角度 θ。

过程分三步：

第 1 步： 将入射斯托克斯矢量从实验室坐标系 (x, y) 变换到元件坐标系 (x′, y′)

S ′ = R ( 2 θ ) ⋅ S S' = R(2\theta) \cdot S S′=R(2θ)⋅S

其中 R(2θ) 就是上一节的旋转器矩阵。

第 2 步： 在元件坐标系中施加元件本身的穆勒矩阵 M

S ′ ′ = M ⋅ S ′ S'' = M \cdot S' S′′=M⋅S′

第 3 步： 将结果变换回实验室坐标系（反向旋转 −θ）

S ′ ′ ′ = R ( − 2 θ ) ⋅ S ′ ′ S''' = R(-2\theta) \cdot S'' S′′′=R(−2θ)⋅S′′

4.4.2 最终公式

合并三步：

M ( θ ) = R ( − 2 θ ) ⋅ M ⋅ R ( 2 θ ) \boxed{M(\theta) = R(-2\theta) \cdot M \cdot R(2\theta)} M(θ)=R(−2θ)⋅M⋅R(2θ)

其中旋转矩阵 R(α) 为：

R ( α ) = $1 0 0 0 0 cos α sin α 0 0 - sin α cos α 0 0 0 0 1$ R(\alpha) = \begin{bmatrix} 1 & 0 & 0 & 0 \\ 0 & \cos\alpha & \sin\alpha & 0 \\ 0 & -\sin\alpha & \cos\alpha & 0 \\ 0 & 0 & 0 & 1 \end{bmatrix} R(α)= 10000cosα−sinα00sinαcosα00001

4.4.3 实例：旋转 θ 角度的水平偏振片

使用上述公式，从理想水平偏振片 M_H 出发，旋转 θ 角度后的穆勒矩阵为：

M H ( θ ) = 1 2 $1 cos 2 θ sin 2 θ 0 cos 2 θ cos 2 2 θ cos 2 θ sin 2 θ 0 sin 2 θ cos 2 θ sin 2 θ sin 2 2 θ 0 0 0 0 0$ M_H(\theta) = \frac{1}{2} \begin{bmatrix} 1 & \cos 2\theta & \sin 2\theta & 0 \\ \cos 2\theta & \cos^2 2\theta & \cos 2\theta \sin 2\theta & 0 \\ \sin 2\theta & \cos 2\theta \sin 2\theta & \sin^2 2\theta & 0 \\ 0 & 0 & 0 & 0 \end{bmatrix} MH(θ)=21 1cos2θsin2θ0cos2θcos22θcos2θsin2θ0sin2θcos2θsin2θsin22θ00000

验证： 当 θ = 0° 时，cos 0° = 1, sin 0° = 0，矩阵退化为 M_H。当 θ = 90° 时，cos 180° = −1, sin 180° = 0，退化为 M_V。✓

4.4.4 实例：旋转 θ 角度的波片

对于延迟量为 φ 的波片，将其快轴旋转到与 x 轴成 θ 角度，则穆勒矩阵为：

M retarder ( θ , φ ) = $1 0 0 0 0 cos 2 2 θ + cos φ sin 2 2 θ ( 1 - cos φ ) sin 2 θ cos 2 θ sin φ sin 2 θ 0 ( 1 - cos φ ) sin 2 θ cos 2 θ sin 2 2 θ + cos φ cos 2 2 θ - sin φ cos 2 θ 0 - sin φ sin 2 θ sin φ cos 2 θ cos φ$ M_{\text{retarder}}(\theta, \varphi) = \begin{bmatrix} 1 & 0 & 0 & 0 \\ 0 & \cos^2 2\theta + \cos\varphi \sin^2 2\theta & (1 - \cos\varphi)\sin 2\theta \cos 2\theta & \sin\varphi \sin 2\theta \\ 0 & (1 - \cos\varphi)\sin 2\theta \cos 2\theta & \sin^2 2\theta + \cos\varphi \cos^2 2\theta & -\sin\varphi \cos 2\theta \\ 0 & -\sin\varphi \sin 2\theta & \sin\varphi \cos 2\theta & \cos\varphi \end{bmatrix} Mretarder(θ,φ)= 10000cos22θ+cosφsin22θ(1−cosφ)sin2θcos2θ−sinφsin2θ0(1−cosφ)sin2θcos2θsin22θ+cosφcos22θsinφcos2θ0sinφsin2θ−sinφcos2θcosφ

这个看起来复杂，但本质就是 R(−2θ) · M_retarder(φ) · R(2θ) 的展开。实际编程中直接做矩阵乘法比手写这个展开式更方便。

五、多个元件的级联------顺序很重要

5.1 级联规则

当光依次通过 N 个光学元件时（每个元件的穆勒矩阵分别为 M₁, M₂, ..., M_N），出射光为：

S ′ = M N ⋅ . . . ⋅ M 2 ⋅ M 1 ⋅ S S' = M_N \cdot ... \cdot M_2 \cdot M_1 \cdot S S′=MN⋅...⋅M2⋅M1⋅S

关键记忆规则：后经历的矩阵写在左边。

5.2 矩阵乘法不交换

穆勒矩阵的乘法不满足交换律：M₁ · M₂ ≠ M₂ · M₁。

举个例子------设有三个元件：

P：水平偏振片
R：45° 波片
S：待测样品

正确的顺序是光先经过 P，再经过 S，最后经过 R。对应的矩阵乘法顺序是 R · S · P · S_入射。写反了就会得到完全不同的结果。

5.3 一个简单但有效的验算方法

写完级联矩阵后，选一个已知的入射光（比如非偏振光 $1,0,0,0$ ᵀ 或水平线偏振光 $1,1,0,0$ ᵀ），手工计算输出，看是否符合物理直觉。这个方法能快速发现顺序错误。

六、看不懂矩阵怎么办？------极分解与约化参数

前面我们推导了各种元件的穆勒矩阵，那些矩阵虽然也包含 16 个数字，但因为我们知道元件的物理性质，所以可以对应解读。

但对于一个未知样品，比如一块你完全不了解的薄膜或生物组织，仪器测量出来就是一个 4×4 = 16 个数字的矩阵。怎么从中提取有意义的物理信息？

一个实测的穆勒矩阵。16 个数字摆在这里，你能直接说出这个样品有什么特性吗？答案是：不能。所以需要做进一步处理。

6.1 Lu-Chipman 极分解

最经典的方法是 Lu-Chipman 极分解（S. Lu and R. A. Chipman, J. Opt. Soc. Am. A, Vol. 13, 1996）。

核心思想：任意一个穆勒矩阵，都可以唯一地（在大多数情况下）分解为三个具有独立物理意义的子矩阵的乘积：

M = M Δ ⋅ M R ⋅ M D \boxed{M = M_\Delta \cdot M_R \cdot M_D} M=MΔ⋅MR⋅MD

三个子矩阵的含义：

子矩阵	符号	物理含义	对应的"极端元件"
二向衰减矩阵	M_D	对不同偏振方向的光的透过率不同	理想偏振片
相位延迟矩阵	M_R	对不同偏振方向的光传播速度不同，引入相位差	理想波片
退偏矩阵	M_Δ	降低光的偏振度，破坏偏振态的相干性	散射介质、毛玻璃

通俗类比：

这有点像把一道菜的味道分解成酸、甜、苦、辣几味------你吃到的是综合口感，但厨师需要知道各多少克糖、醋、盐才能调整配方。极分解就是偏振光学里的"味觉分析仪"。

6.2 五大类约化参数详解

从分解后的三个子矩阵中，可以提取以下具有直接物理意义的约化参数（Reduced Parameters）：

① 透过率（Transmittance）

定义： 非偏振光穿过样品后，透过的光强百分比。

T = m 11 （穆勒矩阵的 (1,1) 元素就是透过率） T = m_{11} \quad \text{（穆勒矩阵的 (1,1) 元素就是透过率）} T=m11（穆勒矩阵的 (1,1) 元素就是透过率）

② 二向衰减（Diattenuation）

物理本质： 样品对不同的入射偏振态有不同的透过率。这是偏振片的核心特性。

衰减幅值（Diattenuation Magnitude）：

D = T max ⁡ − T min ⁡ T max ⁡ + T min ⁡ D = \frac{T_{\max} - T_{\min}}{T_{\max} + T_{\min}} D=Tmax+TminTmax−Tmin

D = 0：样品没有二向衰减（对各方向偏振一视同仁）
D = 1：样品是理想偏振片（完全消光一个方向）
0 < D < 1：实际偏振片的效率

透过轴（Transmission Axis）： 在邦加球上表示透过率最大的那个入射偏振态。对于线偏振片，这就是它的透过轴方位角。

③ 偏振度（Polarizance）

物理本质： 样品将非偏振光变成偏振光的能力------和二向衰减有相关性，但两者在数学上不完全等同。

偏振度幅值： 非偏振光入射时，出射光的偏振度（范围 0 ~ 1）。
偏振度轴： 出射偏振态在邦加球上的位置。

为什么"二向衰减"和"偏振度"是两个独立参数？

对于大多数无退偏的样品，二向衰减和偏振度是相等的。但如果样品有退偏效应（比如散射介质），一个很大的二向衰减可能对应不大的偏振度------因为退偏把出射光的偏振态又打散了。

④ 相位延迟（Retardance）

物理本质： 两个正交偏振分量以不同速度传播，产生相位差。这是波片、液晶、应力双折射等效应背后的核心机制。

延迟量（Retardance Magnitude）： 最快和最慢分量之间的总相位差。可以用多种单位表示：

角度： 如 90°（四分之一波片）、180°（半波片）
纳米： 如对 550 nm 的光，四分之一波片的延迟约为 137.5 nm
波长分数： 用波长 λ 为单位，如 λ/4、λ/2

快轴方向（Fast Axis）： 在邦加球上的位置，指示哪个偏振方向传播得最快。这也是一个完整的三维偏振态------不限于线性，还可以是椭圆的。

⑤ 退偏（Depolarization）

物理本质： 降低入射光的偏振度。

退偏系数 χ（0 ≤ χ ≤ 1）：

χ = 0：无退偏（保持入射光的偏振度）
χ = 1：完全退偏（出射光完全没有偏振特性）

退偏效应在以下场景中非常重要：生物组织成像（散射退偏）、粗糙表面检测、大气光学（云、雾对偏振的影响）等。

6.3 约化参数的"完备性"

一个非常重要的结论：穆勒矩阵包含了样品所有的偏振信息 ，极分解提取出的约化参数------透过率、二向衰减（幅值+方向）、偏振度（幅值+方向）、相位延迟（量+快轴方向）、退偏系数------共同构成了对样品偏振特性的完整描述。

没有任何偏振性质被遗漏或近似掉。这是穆勒矩阵方法相较于其他偏振表征方法（如琼斯矩阵）的核心优势------琼斯矩阵不能描述部分偏振光和退偏效应。

七、工程应用场景

7.1 液晶面板测试

液晶显示器（LCD）的每个像素本质上是微型液晶盒，其偏振特性直接决定了显示质量。利用穆勒矩阵方法（Mueller Matrix Method, MMM），可以同时测量以下全部参数------不需要多次不同的测量设置：

参数	说明
盒厚（Cell Gap）	液晶层厚度，影响响应时间和颜色
扭曲角（Twist Angle）	液晶分子从上基板到下基板的旋转角度
取向层方向（Rubbing Direction）	CF（彩色滤光片）侧和 TFT（薄膜晶体管）侧的取向方向分别获得
预倾角（Pretilt Angle）	液晶分子在基板表面的倾斜角度，CF 侧和 TFT 侧分别获得

该方法适用于 TN、VA、IPS、FFS 等任何液晶模式。

7.2 椭偏测量（Ellipsometry）

椭偏仪是半导体和光学镀膜行业的核心检测工具，用于测量薄膜的厚度和折射率。

原理链路：

复制代码

入射光（已知偏振态）
    ↓ 照射到薄膜样品表面，反射
反射光（偏振态改变了）
    ↓ 测量穆勒矩阵
    ↓ 从中提取 Ψ 和 Δ 参数
    （Ψ = 振幅比角，与二向衰减有关）
    （Δ = 相位差角，与相位延迟有关）
    ↓ 建立薄膜光学模型（膜厚 d、折射率 n、消光系数 k 作为未知参数）
    ↓ 将模型预测的 Ψ_model 和 Δ_model 与实测值做拟合
    ↓ 得到薄膜厚度和光学常数

因为穆勒矩阵包含了样品的全部偏振信息，所以一次测量可以同时确定膜厚、折射率等多个参数------这是单波长椭偏仪做不到的。

7.3 应力双折射检测

玻璃、塑料等透明材料在受到机械应力时，会表现出双折射（应力-光学效应）。测量其穆勒矩阵中的相位延迟分布，可以定量得到材料内部的应力分布。这在光学透镜制造、汽车玻璃检测等领域有广泛应用。

7.4 生物组织成像

生物组织（如皮肤、视网膜）的散射退偏特性携带了结构信息。通过穆勒矩阵成像（Mueller Matrix Imaging），可以实现对癌变组织与正常组织的区分------因为癌变组织的细胞排列紊乱，退偏特性与正常组织明显不同。这是偏振医学成像的热点研究方向。

八、总结：一张图理清全部逻辑

复制代码

═══════════════════════════════════════════════════════════════
                      穆勒矩阵全景图
═══════════════════════════════════════════════════════════════

  [入射光]
      │
      │  斯托克斯矢量 S = [S₀, S₁, S₂, S₃]ᵀ
      │  4 个实数，完整描述偏振态（含部分偏振和非偏振）
      │
      ▼
  ┌─────────────────────────────────────────┐
  │         穆勒矩阵 M（4×4 = 16 元素）      │
  │                                         │
  │  已知元件：直接用公式写矩阵               │
  │    · 偏振片：M = f(pₓ, p_y, θ)          │
  │    · 波片：  M = f(φ, θ)                │
  │    · 旋转器：M = f(θ)                    │
  │    · 旋转公式：M(θ) = R(−2θ)·M·R(2θ)    │
  │                                         │
  │  未知样品：仪器测量得到 16 个数值          │
  └─────────────────────────────────────────┘
      │
      │  S' = M · S（矩阵乘法）
      │
      ▼
  [出射光]  S' = [S'₀, S'₁, S'₂, S'₃]ᵀ

  ═══════════ 如果是未知样品，继续 ═══════════

  [穆勒矩阵 M 的 16 个数值]
      │
      │  Lu-Chipman 极分解：M = M_Δ · M_R · M_D
      │
      ▼
  ┌──────────────────────────────────────────┐
  │            约化参数（有物理意义）          │
  │                                          │
  │  ① 透过率 T      ------ 非偏振光透过的百分比  │
  │  ② 二向衰减 D    ------ 偏振选择性吸收能力    │
  │     · 幅值：T_max−T_min / T_max+T_min    │
  │     · 方向：透过轴（邦加球上的点）         │
  │  ③ 偏振度 P      ------ 产生偏振光的能力      │
  │     · 幅值：出射偏振度（0~1）             │
  │     · 方向：偏振轴（邦加球上的点）         │
  │  ④ 相位延迟 R    ------ 正交分量的相位差      │
  │     · 量：延迟量（° / nm / λ 分数）      │
  │     · 方向：快轴（邦加球上的点）           │
  │  ⑤ 退偏系数 χ    ------ 降低偏振度的能力      │
  └──────────────────────────────────────────┘
      │
      ▼
  ┌──────────────────────────────────────────┐
  │           进一步分析（按需选择）            │
  │                                          │
  │  液晶检测 → 盒厚、扭曲角、预倾角           │
  │  椭偏测量 → Ψ, Δ → 膜厚、折射率          │
  │  应力检测 → 延迟量分布 → 应力分布         │
  │  生物成像 → 退偏参数 → 组织鉴别           │
  └──────────────────────────────────────────┘

最后几点核心认识

穆勒矩阵是琼斯矩阵的"升级版"： 琼斯矩阵只能处理完全偏振光，穆勒矩阵能处理所有偏振状态------包括自然光和部分偏振光。
16 个数字不是孤立的： 通过极分解，它们被"翻译"成有物理意义的约化参数。这个翻译过程是数学上严格的，不是近似。
穆勒矩阵是"面向未来"的测量： 因为它包含了样品所有的偏振信息，一旦完成测量，即使将来需要分析新的参数，也不需要重新测量------只需要改变数据分析方法。
学会旋转公式 M(θ) = R(−2θ)·M·R(2θ)： 这是实际光路设计中使用最频繁的操作。任何元件的本征矩阵只需要查一次，旋转到任意角度用这个公式即可。
矩阵顺序不能随便换： M₁·M₂ ≠ M₂·M₁。光先经过的元件，其矩阵写在右边。

参考资料

Axometrics, Inc. --- Understanding the Mueller Matrix
FiberOptics4Sale --- Mueller Matrices for Polarizing Elements
Ansys Optics --- How to use the Mueller Matrix surface
S. Lu and R. A. Chipman, "Interpretation of Mueller matrices based on polar decomposition," J. Opt. Soc. Am. A, Vol. 13, pp. 1106--1113 (1996).
H. Mueller, "The foundation of optics," J. Opt. Soc. Am., Vol. 38, p. 661 (1948). --- 穆勒矩阵的原始论文

作者说明： 本文是对上述英文资料的综合性中文整理和改写，在保留技术准确性的前提下，力求用通俗语言解释复杂概念。如需深入研究，强烈建议阅读列出的原始英文文献。

标签： #穆勒矩阵 #偏振光学 #斯托克斯矢量 #波片 #偏振片 #极分解 #液晶检测 #椭偏测量 #光学设计

穆勒矩阵（Mueller Matrix）完全指南——从数学推导到工程应用