适用于资源受限IoT系统的非对称语义图像压缩技术

Compressive Sensing based Asymmetric Semantic Image Compression for Resource-constrained IoT system

基于压缩感知的非对称语义图像压缩技术,适用于资源受限的IoT系统

· 作者: Yujun Huang, Bin Chen, Jianghui Zhang, Qiu Han, Shu-Tao Xia

· 所属机构: 清华大学深圳国际研究生院、哈尔滨工业大学深圳、鹏城实验室、网络科学与网络空间研究院、清华大学国家信息科学与技术研究中心

· 关键词: 物联网、深度学习、压缩感知、图像压缩、语义通信、边缘计算

· 期刊:第 59 届 ACM/IEEE 设计自动化会议论文集

· 时间:2022 年 8 月 23 日

研究背景:

1. 物联网与深度学习的挑战: 物联网(IoT)和深度学习的发展使得机器间语义通信成为可能,但将DNN模型部署在计算和存储能力有限的IoT设备上仍具挑战性。

2. 资源受限IoT系统的需求: 为了在资源受限的IoT系统中实现有效的图像语义压缩,需要设计一种能够减少编码器计算复杂度并优化解码器计算资源的模型。

3. 压缩感知技术: 压缩感知(CS)技术具有轻量级采样操作,适用于资源受限的IoT系统。

研究方法:

1. CS-ASIC模型设计: 提出了一种基于压缩感知的非对称语义图像压缩模型 (CS-ASIC),该模型包括一个轻量级的前端编码器和一个在服务器端卸载的深度迭代解码器。

2. 分割采样: 为了减少模型大小,提出了一种新颖的两阶段分割采样方法,首先进行RGB到YUV的转换以去相关,然后沿空间维度分别采样每个YUV通道。

3. 残差保真块(RFB)深度迭代解码器: 提出了一种基于残差保真块的深度迭代解码器,通过可学习的先验来改善图像质量,通过保真步骤和特征空间中的累积误差来纠正恢复误差。

所示一般来说,训练我们的模型可以分为两部分: (1)一个发射机网络作为一个轻量级的编码器,包括分析变换、量化和熵编码。(2)接收机网络由深度解码器和语义DNN推理模型组成。深度解码器还包含类似的熵解码步骤和合成变换。

我们对这类物联网系统的深度非对称语义压缩模型部署可以分为以下四个步骤:

(1)模型训练:云/边缘服务器用捕获的图像训练整体的深度压缩模型。

(2)模型广播:云/边缘服务器将训练过的轻量级线性编码器广播到物联网设备。

(3)数据上传:物联网设备通过轻量级编码器将捕获的图像编码为比特流。然后将比特流上传到云/边缘服务器。

(4)数据恢复和语义分析:云/边缘服务器使用深度解码器恢复图像。然后通过一些与任务相关的DNN来提取语义信息

实验设计:

1. 实验平台: 在Jetson Nano b01上评估CS-ASIC,并与其他图像压缩方法进行比较。

2. 模型设置: 图像块的宽度和高度设置为10,YUV通道的测量次数分别为28、10和10,迭代次数K设置为2,特征图的维度为64。

3. 评估数据集: 在Cityscapes和KITTI数据集上进行实验,这些数据集包含用于图像分割和对象检测的高质量像素级注释。

结果分析:

1. 数据-语义率失真性能比较: CS-ASIC在保持与JPEG相似的推理准确性的同时,压缩率是JPEG的1.53.8倍;在保持与JPEG相似的数据失真情况下,压缩率是JPEG的1.5 2.5倍。

2. 多任务场景: CS-ASIC在对象检测和图像分割任务上取得了最佳的推理准确性。

3. IoT设备部署成本: CS-ASIC与JPEG具有相当的低复杂度,而WebP和H.264由于其高复杂度的帧内预测而需要更多的资源。深度对称图像压缩如Ballé(2017)在CPU实现上比CS-ASIC多约170倍,在GPU实现上多约35倍。


总体结论:

1. CS-ASIC模型的优势: CS-ASIC通过在前端编码器部署轻量级可学习编码器和在中心解码器部署深度迭代重建网络,验证了在低复杂度编码约束下优于其他方法。

2. 未来工作展望: 计划将CSDIC框架扩展到异构前端设备,实现自适应编码,并设计一种适用于资源受限场景的新视频编码算法。

相关推荐
千宇宙航3 小时前
闲庭信步使用SV搭建图像测试平台:第三十一课——基于神经网络的手写数字识别
图像处理·人工智能·深度学习·神经网络·计算机视觉·fpga开发
IT古董3 小时前
【第二章:机器学习与神经网络概述】04.回归算法理论与实践 -(4)模型评价与调整(Model Evaluation & Tuning)
神经网络·机器学习·回归
onceco3 小时前
领域LLM九讲——第5讲 为什么选择OpenManus而不是QwenAgent(附LLM免费api邀请码)
人工智能·python·深度学习·语言模型·自然语言处理·自动化
天水幼麟4 小时前
动手学深度学习-学习笔记(总)
笔记·深度学习·学习
天水幼麟6 小时前
动手学深度学习-学习笔记【二】(基础知识)
笔记·深度学习·学习
TESmart碲视7 小时前
HKS201-M24 大师版 8K60Hz USB 3.0 适用于 2 台 PC 1台显示器 无缝切换 KVM 切换器
单片机·嵌入式硬件·物联网·游戏·计算机外设·电脑·智能硬件
强哥之神9 小时前
英伟达发布 Llama Nemotron Nano 4B:专为边缘 AI 和科研任务优化的高效开源推理模型
人工智能·深度学习·语言模型·架构·llm·transformer·边缘计算
TDengine (老段)10 小时前
TDengine STMT2 API 使用指南
java·大数据·物联网·时序数据库·iot·tdengine·涛思数据
陈敬雷-充电了么-CEO兼CTO11 小时前
大模型技术原理 - 基于Transformer的预训练语言模型
人工智能·深度学习·语言模型·自然语言处理·chatgpt·aigc·transformer
旷世奇才李先生11 小时前
Pillow 安装使用教程
深度学习·microsoft·pillow