适用于资源受限IoT系统的非对称语义图像压缩技术

Compressive Sensing based Asymmetric Semantic Image Compression for Resource-constrained IoT system

基于压缩感知的非对称语义图像压缩技术,适用于资源受限的IoT系统

· 作者: Yujun Huang, Bin Chen, Jianghui Zhang, Qiu Han, Shu-Tao Xia

· 所属机构: 清华大学深圳国际研究生院、哈尔滨工业大学深圳、鹏城实验室、网络科学与网络空间研究院、清华大学国家信息科学与技术研究中心

· 关键词: 物联网、深度学习、压缩感知、图像压缩、语义通信、边缘计算

· 期刊:第 59 届 ACM/IEEE 设计自动化会议论文集

· 时间:2022 年 8 月 23 日

研究背景:

1. 物联网与深度学习的挑战: 物联网(IoT)和深度学习的发展使得机器间语义通信成为可能,但将DNN模型部署在计算和存储能力有限的IoT设备上仍具挑战性。

2. 资源受限IoT系统的需求: 为了在资源受限的IoT系统中实现有效的图像语义压缩,需要设计一种能够减少编码器计算复杂度并优化解码器计算资源的模型。

3. 压缩感知技术: 压缩感知(CS)技术具有轻量级采样操作,适用于资源受限的IoT系统。

研究方法:

1. CS-ASIC模型设计: 提出了一种基于压缩感知的非对称语义图像压缩模型 (CS-ASIC),该模型包括一个轻量级的前端编码器和一个在服务器端卸载的深度迭代解码器。

2. 分割采样: 为了减少模型大小,提出了一种新颖的两阶段分割采样方法,首先进行RGB到YUV的转换以去相关,然后沿空间维度分别采样每个YUV通道。

3. 残差保真块(RFB)深度迭代解码器: 提出了一种基于残差保真块的深度迭代解码器,通过可学习的先验来改善图像质量,通过保真步骤和特征空间中的累积误差来纠正恢复误差。

所示一般来说,训练我们的模型可以分为两部分: (1)一个发射机网络作为一个轻量级的编码器,包括分析变换、量化和熵编码。(2)接收机网络由深度解码器和语义DNN推理模型组成。深度解码器还包含类似的熵解码步骤和合成变换。

我们对这类物联网系统的深度非对称语义压缩模型部署可以分为以下四个步骤:

(1)模型训练:云/边缘服务器用捕获的图像训练整体的深度压缩模型。

(2)模型广播:云/边缘服务器将训练过的轻量级线性编码器广播到物联网设备。

(3)数据上传:物联网设备通过轻量级编码器将捕获的图像编码为比特流。然后将比特流上传到云/边缘服务器。

(4)数据恢复和语义分析:云/边缘服务器使用深度解码器恢复图像。然后通过一些与任务相关的DNN来提取语义信息

实验设计:

1. 实验平台: 在Jetson Nano b01上评估CS-ASIC,并与其他图像压缩方法进行比较。

2. 模型设置: 图像块的宽度和高度设置为10,YUV通道的测量次数分别为28、10和10,迭代次数K设置为2,特征图的维度为64。

3. 评估数据集: 在Cityscapes和KITTI数据集上进行实验,这些数据集包含用于图像分割和对象检测的高质量像素级注释。

结果分析:

1. 数据-语义率失真性能比较: CS-ASIC在保持与JPEG相似的推理准确性的同时,压缩率是JPEG的1.53.8倍;在保持与JPEG相似的数据失真情况下,压缩率是JPEG的1.5 2.5倍。

2. 多任务场景: CS-ASIC在对象检测和图像分割任务上取得了最佳的推理准确性。

3. IoT设备部署成本: CS-ASIC与JPEG具有相当的低复杂度,而WebP和H.264由于其高复杂度的帧内预测而需要更多的资源。深度对称图像压缩如Ballé(2017)在CPU实现上比CS-ASIC多约170倍,在GPU实现上多约35倍。


总体结论:

1. CS-ASIC模型的优势: CS-ASIC通过在前端编码器部署轻量级可学习编码器和在中心解码器部署深度迭代重建网络,验证了在低复杂度编码约束下优于其他方法。

2. 未来工作展望: 计划将CSDIC框架扩展到异构前端设备,实现自适应编码,并设计一种适用于资源受限场景的新视频编码算法。

相关推荐
BY—-组态6 分钟前
web组态软件
前端·物联网·工业互联网·web组态·组态
思通数科多模态大模型29 分钟前
10大核心应用场景,解锁AI检测系统的智能安全之道
人工智能·深度学习·安全·目标检测·计算机视觉·自然语言处理·数据挖掘
数据岛33 分钟前
数据集论文:面向深度学习的土地利用场景分类与变化检测
人工智能·深度学习
学不会lostfound1 小时前
三、计算机视觉_05MTCNN人脸检测
pytorch·深度学习·计算机视觉·mtcnn·p-net·r-net·o-net
红色的山茶花1 小时前
YOLOv8-ultralytics-8.2.103部分代码阅读笔记-block.py
笔记·深度学习·yolo
白光白光1 小时前
凸函数与深度学习调参
人工智能·深度学习
sp_fyf_20241 小时前
【大语言模型】ACL2024论文-18 MINPROMPT:基于图的最小提示数据增强用于少样本问答
人工智能·深度学习·神经网络·目标检测·机器学习·语言模型·自然语言处理
weixin_543662861 小时前
BERT的中文问答系统33
人工智能·深度学习·bert
爱喝白开水a1 小时前
Sentence-BERT实现文本匹配【分类目标函数】
人工智能·深度学习·机器学习·自然语言处理·分类·bert·大模型微调
Mr.谢尔比2 小时前
李宏毅机器学习课程知识点摘要(1-5集)
人工智能·pytorch·深度学习·神经网络·算法·机器学习·计算机视觉