文献阅读:Semantic Communications for Speech Signals

目录


论文简介

  • 作者

    Zhenzi Weng

    Zhijin Qin

    Geoffrey Ye Liy

  • 发表期刊or会议

    《ICC》

  • 发表时间

    2021.6


动机:为什么作者想要解决这个问题?

  • 对语音信号传输的语义通信的研究没有开展
  • 论文里提到:分块设计系统已被证明是次优的,传统的线性信号处理算法无法捕获实际信道中的许多缺陷和非线性

贡献:作者在这篇论文中完成了什么工作(创新点)?

  • 首次提出了语音信号语义通信系统DeepSC-S,将整个收发器视为两个深度神经网络(speech encoder------注意力机制;channel encoder------CNN),并联合设计语音编码和信道编码来处理信源失真和信道效应。
  • DeepSC-S基于squeeze and excitation (SE) networks (就是找了一个那时候比较火的网络罢了)
  • 通过在固定衰落信道和信噪比下训练 DeepSC-S,然后在动态信道(AWGN,瑞丽,莱斯)环境下测试,所提出的 DeepSC-S 具有高度鲁棒性,无需网络调整和重新训练(这太扯了)

规划:他们如何完成工作?

  • 整体框架


    这结构真没什么好说的,需要的时候看论文II和III吧(和DeepSC一个套路,就在这encoder,decoder的)

  • 损失函数

    采用均方误差(MSE)作为损失函数,测量 s s s和 s ^ \hat s s^之间的差异
    L M S E ( θ T , θ R ) = 1 W ∑ w = 1 W ( s w − s ^ w ) 2 \mathcal{L}{M S E}\left(\boldsymbol{\theta}^{\mathcal{T}}, \boldsymbol{\theta}^{\mathcal{R}}\right)=\frac{1}{W} \sum{w=1}^W\left(s_w-\widehat{s}_w\right)^2 LMSE(θT,θR)=W1w=1∑W(sw−s w)2

  • 误差度量

    采用信号失真比(SDR)来测量 s s s和 s ^ \hat s s^之间的L2误差:
    S D R = 10 log ⁡ 10 ( ∥ s ∥ 2 ∥ s − s ^ ∥ 2 ) . S D R=10 \log _{10}\left(\frac{\|\boldsymbol{s}\|^2}{\|\boldsymbol{s}-\widehat{\boldsymbol{s}}\|^2}\right) . SDR=10log10(∥s−s ∥2∥s∥2).


自己的看法(作者如何得到的创新思路)

这篇论文,一言难尽,大概就是找一个新场景(speech),再找一个那时候流行的网络结构(attention),然后套上语义的壳,就是一篇ICC 😭
选择大于努力


相关推荐
二向箔reverse2 分钟前
机器学习入门:线性回归详解与实战
人工智能·机器学习
真就死难9 分钟前
Rerank 模型的其中两种路径:BERT 相似度与 CoT 推理
人工智能·机器学习·rag
无规则ai18 分钟前
AI三巨头:机器学习、深度学习与人工智能解析
人工智能·深度学习·机器学习
不剪发的Tony老师28 分钟前
字节跳动正式开源AI智能体开发平台Coze
人工智能·coze
love530love32 分钟前
Windows 如何更改 ModelScope 的模型下载缓存位置?
运维·人工智能·windows·python·缓存·modelscope
一百天成为python专家3 小时前
数据可视化
开发语言·人工智能·python·机器学习·信息可视化·numpy
金井PRATHAMA3 小时前
主要分布在背侧海马体(dHPC)CA1区域(dCA1)的时空联合细胞对NLP中的深层语义分析的积极影响和启示
人工智能·神经网络·自然语言处理
说私域3 小时前
技术赋能与营销创新:开源链动2+1模式AI智能名片S2B2C商城小程序的流量转化路径研究
人工智能·小程序·开源
倒悬于世6 小时前
开源的语音合成大模型-Cosyvoice使用介绍
人工智能·python·语音识别
pk_xz1234567 小时前
光电二极管探测器电流信号处理与指令输出系统
人工智能·深度学习·数学建模·数据挖掘·信号处理·超分辨率重建