论文阅读—2023.7.13:遥感图像语义分割空间全局上下文信息网络(主要为unet网络以及改unet)附加个人理解与代码解析

前期看的文章大部分都是深度学习原理含量多一点,一直在纠结怎么改模型,论文看的很吃力,看一篇忘一篇,总感觉摸不到方向。想到自己是遥感专业,所以还是回归遥感影像去谈深度学习,回归问题,再想着用什么方法解决问题。

一、问题与解决方法

1、易丢失空间信息

在 Decoder 阶段输出多尺度特征,与 ReEncoder 阶段结合获取全局上下文信息

2、边界信息不明确

保留边界损失函数,设计多尺度损失函数级联方法

Attention U-Net,在 U-Net 网络高低级语义信息融 合的过程中,加入注意力控制模块( Attention gates),强化了有效信息的传递,对无效信息的传输进行抑制。

二、原理

1、问题一的原理

Unet网络

参考这三篇,写的特别详细

Pytorch深度学习实战教程(二):UNet语义分割网络 - 知乎 (zhihu.com)

Pytorch深度学习实战教程(三):UNet模型训练,深度解析! - 知乎 (zhihu.com)

(个人记录:损失函数优化器选择)

U-Net原理分析与代码解读 - 知乎 (zhihu.com)

作者的网络

网络可以看懂,但是不懂这样做可以解决第一个问题的原理。

2、问题2的原理

结果

相关推荐
m0_6501082418 小时前
DSGN:基于深度立体几何网络的 3D 目标检测革新
论文阅读·3d目标检测·立体视觉·3d几何体积表示·端到端联合优化·dsgn
m0_6501082418 小时前
FlashLightNet:实时检测与分类静态和闪烁交通灯状态的端到端深度学习框架
论文阅读·自动驾驶·视觉单模态·交通灯状态检测·flashlightnet
m0_6501082419 小时前
PETR:多视图 3D 目标检测的位置嵌入变换新范式
论文阅读·自动驾驶·位置编码·视觉单模态·多视角3d目标检测·petr·3d位置信息与2d特征
Cuby!19 小时前
IEEE Wireless Communications 2025年论文整理2(中英文摘要)
论文阅读·学习·信息与通信
youcans_1 天前
【医学影像 AI】FunBench:评估多模态大语言模型的眼底影像解读能力
论文阅读·人工智能·大语言模型·多模态·眼底图像
Cuby!2 天前
【AFDM与信号处理:论文阅读】仿射频分复用:扩展OFDM以实现场景灵活性和弹性
论文阅读·笔记·学习·信息与通信·信号处理
m0_650108242 天前
DETR3D:基于 3D-to-2D 查询的多视图 3D 目标检测框架
论文阅读·自动驾驶·3d目标检测·rgb 多视角图像·无预测深度图依赖·detr3d
m0_650108242 天前
UniAD:面向规划的端到端自动驾驶统一框架
论文阅读·自动驾驶·uniad·ad全栈统一框架·端到端闭环·目标导向的任务协同·视觉单模态
CV-杨帆3 天前
论文阅读:arxiv 2025 DeepSeek-R1 Thoughtology: Let‘s think about LLM Reasoning
论文阅读
QFIUNE3 天前
【文献阅读】DP-Site:一种基于双重深度学习的蛋白质-肽相互作用位点预测方法
论文阅读