文献阅读：Semantic Communications for Speech Signals

论文简介

首次提出了语音信号语义通信系统DeepSC-S，将整个收发器视为两个深度神经网络(speech encoder------注意力机制；channel encoder------CNN)，并联合设计语音编码和信道编码来处理信源失真和信道效应。
DeepSC-S基于squeeze and excitation (SE) networks (就是找了一个那时候比较火的网络罢了)
通过在固定衰落信道和信噪比下训练 DeepSC-S，然后在动态信道(AWGN，瑞丽，莱斯)环境下测试，所提出的 DeepSC-S 具有高度鲁棒性，无需网络调整和重新训练(这太扯了)

整体框架

这结构真没什么好说的，需要的时候看论文II和III吧(和DeepSC一个套路，就在这encoder，decoder的)
损失函数

采用均方误差(MSE)作为损失函数，测量 s s s和 s ^ \hat s s^之间的差异
L M S E ( θ T , θ R ) = 1 W ∑ w = 1 W ( s w − s ^ w ) 2 \mathcal{L}{M S E}\left(\boldsymbol{\theta}^{\mathcal{T}}, \boldsymbol{\theta}^{\mathcal{R}}\right)=\frac{1}{W} \sum{w=1}^W\left(s_w-\widehat{s}_w\right)^2 LMSE(θT,θR)=W1w=1∑W(sw−s w)2
误差度量

采用信号失真比（SDR）来测量 s s s和 s ^ \hat s s^之间的L2误差：
S D R = 10 log ⁡ 10 ( ∥ s ∥ 2 ∥ s − s ^ ∥ 2 ) . S D R=10 \log _{10}\left(\frac{\|\boldsymbol{s}\|^2}{\|\boldsymbol{s}-\widehat{\boldsymbol{s}}\|^2}\right) . SDR=10log10(∥s−s ∥2∥s∥2).

这篇论文，一言难尽，大概就是找一个新场景(speech)，再找一个那时候流行的网络结构(attention)，然后套上语义的壳，就是一篇ICC 😭
选择大于努力