论文阅读:基于超像素的图卷积语义分割(图结构数据)

#Superpixel-based Graph Convolutional Network for Semantic Segmentation
github链接

引言

GNN模型根据节点特征周围的边来训练节点特征,并获得最终的节点嵌入。通过利用具有不同滤波核的二维卷积对来自附近节点的信息进行整合,给定超像素方法生成的特征信息。本文是基于图卷积神经网络,利用超像素图斑对象构建图结构数据,通过对节点实现语义分类,实现超像素分割。

  • 图学习框架:
    * 转导学习的训练和预测阶段,边缘和节点保持不变。因此,它不允许泛化到不可见的节点和边。
    * 归纳学习始于在具有某些图属性的训练网络中学习模型。经过训练的模型可以近似训练图中可能链接的未知特征。
  • 图卷积与CNN具有相同的属性:
    通过普卷积与空间卷积进行分类
    * 谱图卷积使用基于图信号傅里叶变换的谱滤波器,即图拉普拉斯矩阵的特征分解。但是,它需要一个完整且固定的图,因为图拉普拉斯依赖于整体图结构
    * Spatai卷积网络学习节点嵌入函数,仅反映节点的局部邻域,而不是引用整个图,该模型成功地处理了看不见的图或图中的连续变化
实验结果:



这是一篇2019-2020年的文章,文章的算法精度不是很高,实验数据是无人机数据,相较于经典的CNN与transformer深度学习算法的精度是稍差一些,但对于一些样本数据较少的可能提供一些解决思路,单张输入影像可以达到3000*3000左右,这里利用超像素在一定程度上实现了数据降维的作用。

看过文章提供的代码后发现,文章在构建图结构信息的时候,仅使用了超像素图斑的像素平均值作为特征。有关图卷积神经网络比较新的文章采用的策略是先通过卷积神经网络进行特征提取,然后采用图结构作为解码端去结合一些先验信息实现分类或分割,后续会更新一篇相关文章作为参考。

文章提供的代码基于dgl和pytorch实现,对显存有一定要求。

相关推荐
DuHz20 小时前
无线通信与雷达感知融合的波形设计与信号处理——论文阅读(上)
论文阅读·信号处理
DuHz20 小时前
无线通信与雷达感知融合的波形设计与信号处理——论文阅读(下)
论文阅读·汽车·信息与通信·信号处理
张较瘦_2 天前
[论文阅读] AI + 软件工程 | LLM救场Serverless开发!SlsReuse框架让函数复用率飙升至91%,还快了44%
论文阅读·人工智能·软件工程
m0_650108242 天前
InstructBLIP:面向通用视觉语言模型的指令微调技术解析
论文阅读·人工智能·q-former·指令微调的视觉语言大模型·零样本跨任务泛化·通用视觉语言模型
做cv的小昊3 天前
VLM经典论文阅读:【综述】An Introduction to Vision-Language Modeling
论文阅读·人工智能·计算机视觉·语言模型·自然语言处理·bert·transformer
m0_650108244 天前
PaLM-E:具身智能的多模态语言模型新范式
论文阅读·人工智能·机器人·具身智能·多模态大语言模型·palm-e·大模型驱动
m0_650108244 天前
PaLM:Pathways 驱动的大规模语言模型 scaling 实践
论文阅读·人工智能·palm·谷歌大模型·大规模语言模型·全面评估与行为分析·scaling效应
小殊小殊4 天前
【论文笔记】视频RAG-Vgent:基于图结构的视频检索推理框架
论文阅读·人工智能·深度学习
有点不太正常4 天前
《ShadowCoT: Cognitive Hijacking for Stealthy Reasoning Backdoors in LLMs》——论文阅读
论文阅读·大模型·agent安全
小殊小殊4 天前
【论文笔记】大型语言模型的知识蒸馏与数据集蒸馏
论文阅读·人工智能·深度学习