Joint communication and state sensing under logarithmic loss

摘要------我们研究一种基本的联合通信与感知设置,其中发射机希望向接收机传输一条消息,并同时通过广义反馈估计其信道状态。我们假设感知目标是获得状态的软估计(即概率分布),而非通常假设的点估计;并且我们使用对数损失失真作为保真度度量。聚焦于具有独立同分布(i.i.d.)状态的无记忆设置,我们描述了通信率与感知失真之间的最优权衡。在此过程中,我们阐明了所谓感知互信息效用函数的操作意义。

I. 引言

我们考虑一个双终端联合通信与感知(JCAS)设置,包含一个发射机和一个接收机。发射机希望通过状态依赖的离散无记忆信道(DMC) 向接收机传输一条消息,其中 是发射机发送的输入,是接收机观测到的输出,是信道状态。同时,发射机希望通过广义反馈信道 估计信道状态,输出为 。显然,信道输入 在此扮演双重角色:编码消息以实现通信,探测信道以实现感知。自然地,这两个目标之间存在权衡,因为对第一个目的的最优输入通常对第二个目的并不是最优的。

Kobayashi等人[1]引入了上述基本模型并建立了可靠通信率(按Shannon定义)与状态估计保真度(用可分离失真度量表示)之间的权衡。这引发了一系列进一步的研究和扩展,包括多终端设置[2]-[4]、保密约束设置[5]、[6]和多天线高斯设置[7]等。所有这些工作都遵循相同的建模思路,允许状态以i.i.d.方式从一个信道使用变化到另一个(或更一般地,从一个区块到另一个,如[7]中)。另一种极端情况,即状态在整个传输过程中保持固定,已在[8]-[12]中考虑,假设状态取多个(通常是二进制)值。在当前工作中,我们专注于Kobayashi等人的原始设置,即具有i.i.d.状态。我们的目标是通过关注特定的保真度标准,进一步阐明通信与感知之间的权衡。

建立通信与感知之间基本权衡的一个挑战是选择感知保真度标准,即感知失真度量。一方面,人们理解失真的选择应该是应用特定的;但另一方面,不同的失真度量由不同的估计器最小化,并且常常导致不同的性能权衡。因此,建立一个"通用"的通信与感知权衡,超越特定失真度量选择的依赖,是很有意义的。

一种直观的通信与感知权衡,似乎不依赖于失真选择,可以用条件互信息术语描述为满足以下条件的所有非负元组(R, Γ):

R < I(X;Y|S) 和

对于某些可容许的输入,其分布为。在上式中,R是通信率,Γ是感知效用,通常被称为"感知率"或"感知互信息"[13]、[14]。将互信息用作感知效用函数相对较新,可以追溯到Bell关于雷达波形设计的工作[15](更近期的工作包括[16]-[18])。与通信率不同,感知率没有明确的操作意义。我们将稍后回到这个重要点,但在此之前,值得强调使上述特征化特别有趣的几个方面。

除了(1)中的特征化不依赖于特定的失真度量选择(至少在表面上看是如此)外,它还在的角色中展示了令人愉悦的对偶性。假设接收机知道信道状态S并希望恢复输入X,I(X;Y|S)捕获了观测Y中关于X给定S的信息量。对于发射机,X和S的角色相反,I(S;Z|X)捕获了Z中关于S给定X的信息量。此外,注意对于固定的在输入分布上是凹的,而对于固定的上是线性的。区域边界上的点可通过求解以下问题确定:

对于某个,这是控制权衡的权重。这是一个凸优化问题,可以高效求解,前提是输入字母表的大小是可管理的。

我们现在回到互信息的操作意义。对于通信,这已通过香农编码定理得到充分确立:我们知道存在可靠的编码方案¹,可实现高达互信息的所有速率,当在输入分布上最大化时,得到信道容量。而感知互信息,另一方面,经常被用作效用函数,但没有提供具体的操作解释。[13]中最近报告了一种可能的解释,将感知失真函数通过率-失真理论和数据处理不等式连接到感知互信息。然而,这种连接通常只在一些规范的特殊情况下才紧密成立。此外,这种连接隐含地要求使用率-失真编码来描述信道状态,这在大多数感知应用中可能是不必要的迂回,因为目标是直接估计状态。

在本文中,为了给(1)中的权衡提供具体解释,我们考虑Kobayashi等人[1]的基本设置,但采用不太常规的状态估计框架和失真度量。特别地,我们考虑获取状态的软估计,即概率分布(或信念),而非JCAS文献中更常见的点估计。软估计的保真度通过对数损失(log-loss)来衡量,这在预测和学习理论[19]-[21]以及数据压缩[22]-[24]中被广泛使用。我们描述了通信率与感知失真之间的基本权衡,并证明它可以通过互信息项和条件熵项来表示。这种权衡在某种意义上等同于(1)中的权衡。

II. 系统模型

我们考虑一个状态依赖的DMC,输入为X,输出为Y和Z,状态为S。接收机通过观察Y,而发射机通过广义反馈获得Z,即通过。该信道使用n次,发射机希望通过传输输入序列向接收机发送消息,并同时通过广义反馈信号估计状态序列

编码 :发射机有一个消息W,从中均匀随机抽取。每比特信道的速率定义为:

发射机希望将W发送给接收机,并同时通过广义反馈信道估计状态序列。为此,发射机发送输入序列,其中第个符号根据消息和发射机在当时可获得的先前信道观测选择。因此,编码器是一系列函数,其中产生第个输入符号

我们假设输入序列受到成本约束,通常代表实践中的功率约束。令为成本函数,为每个输入符号的成本预算。则平均约束:

必须对每个成立。

解码 :接收并知道后,接收机将消息解码为,其中是解码器。最大解码错误概率为:

为方便起见,通常使用平均解码错误概率。在操作上,控制最大错误概率更有意义,因为没有消息应该比其他消息有优先权。然而,就渐近可达率而言,通过排除[25]可以证明对最大错误的结果也适用于平均错误。

估计 :接收并知道后,发射机为状态序列产生软估计。与硬估计(即点估计)不同,软估计是上的概率分布(即pmf)。软估计器是一个函数,其中上的概率单纯形。给定,对的软估计记为,其中。注意,如果有单点质量,则软估计简化为点估计。

软估计的保真度通过对数损失失真来衡量。状态序列与软估计之间的对数损失定义为:

对数损失,也称为自信息损失,可理解为给定软估计后关于的剩余不确定性[22], [23]。例如,当且仅当处有单点质量(即精确点估计)时,为零;当下概率为零时,则为无穷大。

给定发送消息w,预期的对数损失失真为:

其中除以n是为了方便渐近分析。类似于最大解码错误概率,我们的失真度量定义为针对消息指标取最大值:

备注1. 也可以通过取消息的平均值来定义失真度量:

这在JCAS的大多数工作[1]-[7]中是常见做法,即各种失真度量通过取消息的平均值而非最大值来定义。我们认为这主要是出于技术便利,但从操作角度看不太合适。给定的感知性能应该无论通信什么消息都能保证,因此最大值似乎更合适。

率-失真区域 :如果对于任何,存在一个编码,使得在足够大的下,,则编码器-解码器-估计器三元组被称为可达的。率-失真区域是所有可达元组的闭包。

III. 主要结果

定理1 . 是可达的当且仅当:


对于某个输入随机变量X,其pmf 满足。上述区域中涉及的随机变量满足

我们将在下一节证明上述定理,但在此之前,先讨论(10)与(1)中率区域的等价性,并给出一个简单例子。

1) 感知率和等效率区域 :我们将在下一节看到,最小化预期对数损失的最优软估计是状态序列的后验分布。在传输前,最小化预期对数损失的软估计是状态序列的先验分布,相应的预期对数损失是每符号。我们将率定义为先验和后验预期对数损失之间的差值。使用这个定义,(10)中的率权衡转换为(1)中的率权衡。

2) 例子

其中是状态,是噪声项,都是伯努利分布,相互独立且独立于X。注意,是相应的伯努利参数,表示模2和。可以证明,在这种情况下,率区域由所有非负值给出,满足:


对于某个参数 ,表示输入 的伯努利参数,其中 是二进制熵函数,。上述权衡生动地捕捉了 所扮演的双重角色。

IV. 定理1的证明

A. 对数损失下的状态感知

现在,我们暂时搁置通信部分,仅关注问题的感知部分。为此,固定一个消息 和一个编码器,并回顾输入序列完全由 确定,即 。给定通过广义反馈被观察到,令人惊讶的是, 的最小化预期对数损失的软估计是后验分布 ,如下所示。

引理1 . 给定和固定编码器 ,预期对数损失的下界为:

当且仅当软估计 取为后验分布 时等式成立。

证明 . 条件于 ,预期对数损失的下界为:

其中 P 用作后验分布 的简写符号。(16)中的不等式源于相对熵(Kullback-Leibler散度)的非负性,当且仅当 时等式成立。通过对给定 取期望,可得(13)。□

类似引理1的结果先前已在源编码[22], [23]和预测[21, Ch. 3.6]的背景下出现。引理1是这些结果对本文感知设置的适应,如下所示,它在定理1的可达性和逆定理证明中都起着核心作用。

B. 逆定理

假设率-失真元组 在成本预算 下可达。为了证明逆定理,我们可以处理平均(而非最大消息)错误概率和对数损失失真,因为 分别意味着

从Fano不等式开始,通过标准步骤(见[26, Ch. 3.1.5]),通信率的上界为:

其中可以通过增加 变得任意小。注意,(21)来自 和数据处理不等式。定义一个输入随机变量 ,其分布 定义为:

,对所有

可以证明,上述定义的随机变量 X满足预期成本约束 (见附录)。利用互信息在输入分布上的凹性和Jensen不等式,我们得到:

现在转向对数损失。我们写道:

其中(27)来自引理1并对 W取期望,而(28)成立是因为 。对于接下来的步骤,我们发现处理感知率 更为方便。我们按如下方式进行:

(32)来自 ,而(34)成立是因为 形成马尔可夫链,因此

从(34)继续,我们写道:

其中我们使用了(23)中定义的输入分布

通过足够增大n,我们可以使(24)和(38)中的变得任意小。令,由此可得(或等价地,),对于某些满足成立,这就证明了逆定理。

C. 可达性

对于可达性部分,只需证明定理1中区域的边界曲线是可达的。该边界曲线由形如(R^*(∆,B),∆)的对组成,其中:

考虑边界曲线上的任意一点,令为满足的输入分布。如我们将看到的,使用非反馈码和非自适应编码器就足够了。这并不奇怪,因为信道和状态序列都是无记忆的(参见[1]、[3])。

固定。每个消息索引映射到一个码字,所有码字共同组成一个码本。状态序列的后验概率分布分解为:

以(40)中的后验分布作为软估计可得:

显然,对于每个,如果所有码本中的码字都从集合中选择,则保证实现的同时满足,其中:

接下来需要证明存在这样一个码本,其速率且错误概率

为此,我们引用一个被称为Feinstein引理的信道编码定理(见[27, 定理18.7])。在该引理的表述中,是从多字母输入分布中抽取的随机输入序列,该分布在集合*上有支撑,且*是条件于状态序列的信息密度。

引理2 . 固定阈值参数。存在一个码本,大小为,且最大解码错误概率满足:

接下来,我们通过适当选择多字母输入分布和阈值参数来证明可实现期望的速率。特别地,我们设:

其中是来自(在可达性开始时定义)的重乘积分布,且。此外,我们设置使得。有了这些选择,(43)中的项随着n趋于无穷而趋于零,如下所示:

其中是相应的接收机输出。根据大数定律,,随着

此外,通过选择使得,(43)中的项也趋于零,因为趋于无穷。因此,对于足够大的,保证了,这就完成了证明。

备注2. 引理2是一个使用Feinstein最大编码和次优阈值解码证明的民间编码定理变体。一个类似但略微较弱的界限也适用于平均编码错误概率,且可以使用Shannon的随机编码与阈值解码来证明。这两种界限都适用于我们证明渐近结果的目的。我们建议读者参考[27, Ch. 18]获取关于这些界限的全面现代处理,它们有时被称为信息谱界限或单次界限³。此外,Feinstein引理的成本约束版本在[27, 定理20.7]中给出,服务于相同目的。

备注3. 定理1的可达性也可以使用更常见的联合典型性方法来证明。为此,使用鲁棒典型性(在El-Gamal和Kim[26]中广泛使用)并调用典型平均引理来处理(42)中的输入成本和感知约束可能最为方便。这基本上是[1]中采用的方法,但使用平均(而非最大)失真度量,相对于最大值略微容易处理。我们选择了通过Feinstein引理使用信息谱单次方法,它具有一些优势。首先,它直接扩展到具有连续字母表的信道(如高斯信道),无需离散化(这是扩展基于鲁棒典型性的证明所需的)。此外,上述可达性结果可通过正态近似(参见[27, 定理19.11])得到有限块长特征化。最后,尽管不是本文的重点,基于Feinstein引理的可达性适用于一般的信道,例如有记忆或非平稳或非遍历[28]的信道。

V. 高斯信道

到目前为止,我们一直考虑具有离散字母表的信道,但这些结果也适用于具有连续字母表的信道,前提是S具有有界微分熵的先验和后验概率密度(即)。高斯信道满足此要求,其输出为:

其中表示状态,是噪声项,都相互独立且独立于。输入受到平均功率(即平方成本)约束,预算为

根据定理1,可以证明,率-失真权衡由所有满足以下条件的对给出:

对于某些满足。注意,在这种情况下,失真(即预期对数损失)可以是负的。等价地,率区域由所有满足以下条件的对给出:

为了比较,我们呈现[1]中在平方损失失真度量下的结果。在这种情况下,率-失真区域由所有满足以下条件的对组成:

根据Jensen不等式,对数损失和平方损失失真都由满足的输入最小化。因此,在最小失真下,二进制相移键控(BPSK)在两种情况下都实现最佳速率。

然而一般来说,(47)和(49)中的权衡并不必然等价。为了理解这一点,令:

为给定条件下从估计的最小均方误差(MMSE)。在速率约束下,通过解决以下问题来最小化平方损失失真:

,满足

在对数损失失真下的相应问题是

其中对目标函数进行指数化处理并忽略常数不会改变问题。注意,(51) 是 MMSE 的算术平均值的最小化问题,作为输入 X的函数,而 (52) 是其几何平均值的最小化问题。这两种情况可能导致不同的最优输入分布。研究这两种情况下最优输入分布的结构是未来工作的内容。

VI. 讨论

通过将 [1] 中的一般速率-失真权衡专门化为对数损失失真,可以得到类似定理 1 的结果 [1,定理 1]。然而,严格来说,这种专门化并不严谨,因为 [1] 中的证明适用于离散重构字母表和可分离失真度量(即单字母失真的归一化和)。软估计不是离散的(即使状态字母表是),且第 II 节中定义的对数损失不是可分离的。后一个问题可以通过将软估计的集合限制为乘积分布来规避,这在我们特定情况下由于独立同分布状态而不是一个主要限制。尽管如此,我们在此提出的问题表述和我们采用的证明技术更为通用,为处理具有记忆的信道铺平了道路。

对状态感知互信息的另一种有效解释是通过列表解码 [29]。然而,这种解释适用于具有离散字母表的信道,对于具有连续字母表的信道似乎不成立。此外,如 [23] 在源编码背景下所示,软估计下的对数损失与一般的LIST大小不完全等价,但在离散字母表下两者在某种程度上是等价的。

相关推荐
AngelPP6 小时前
OpenClaw 架构深度解析:如何把 AI 助手搬到你的个人设备上
人工智能
宅小年6 小时前
Claude Code 换成了Kimi K2.5后,我再也回不去了
人工智能·ai编程·claude
九狼6 小时前
Flutter URL Scheme 跨平台跳转
人工智能·flutter·github
ZFSS6 小时前
Kimi Chat Completion API 申请及使用
前端·人工智能
天翼云开发者社区8 小时前
春节复工福利就位!天翼云息壤2500万Tokens免费送,全品类大模型一键畅玩!
人工智能·算力服务·息壤
知识浅谈8 小时前
教你如何用 Gemini 将课本图片一键转为精美 PPT
人工智能
Ray Liang8 小时前
被低估的量化版模型,小身材也能干大事
人工智能·ai·ai助手·mindx
颜酱9 小时前
单调栈:从模板到实战
javascript·后端·算法
shengjk110 小时前
NanoClaw 深度剖析:一个"AI 原生"架构的个人助手是如何运转的?
人工智能