论文阅读:基于超像素的图卷积语义分割(图结构数据)

#Superpixel-based Graph Convolutional Network for Semantic Segmentation
github链接

引言

GNN模型根据节点特征周围的边来训练节点特征,并获得最终的节点嵌入。通过利用具有不同滤波核的二维卷积对来自附近节点的信息进行整合,给定超像素方法生成的特征信息。本文是基于图卷积神经网络,利用超像素图斑对象构建图结构数据,通过对节点实现语义分类,实现超像素分割。

  • 图学习框架:
    * 转导学习的训练和预测阶段,边缘和节点保持不变。因此,它不允许泛化到不可见的节点和边。
    * 归纳学习始于在具有某些图属性的训练网络中学习模型。经过训练的模型可以近似训练图中可能链接的未知特征。
  • 图卷积与CNN具有相同的属性:
    通过普卷积与空间卷积进行分类
    * 谱图卷积使用基于图信号傅里叶变换的谱滤波器,即图拉普拉斯矩阵的特征分解。但是,它需要一个完整且固定的图,因为图拉普拉斯依赖于整体图结构
    * Spatai卷积网络学习节点嵌入函数,仅反映节点的局部邻域,而不是引用整个图,该模型成功地处理了看不见的图或图中的连续变化
实验结果:



这是一篇2019-2020年的文章,文章的算法精度不是很高,实验数据是无人机数据,相较于经典的CNN与transformer深度学习算法的精度是稍差一些,但对于一些样本数据较少的可能提供一些解决思路,单张输入影像可以达到3000*3000左右,这里利用超像素在一定程度上实现了数据降维的作用。

看过文章提供的代码后发现,文章在构建图结构信息的时候,仅使用了超像素图斑的像素平均值作为特征。有关图卷积神经网络比较新的文章采用的策略是先通过卷积神经网络进行特征提取,然后采用图结构作为解码端去结合一些先验信息实现分类或分割,后续会更新一篇相关文章作为参考。

文章提供的代码基于dgl和pytorch实现,对显存有一定要求。

相关推荐
Ayakanoinu11 小时前
【论文阅读】VAD: Vectorized Scene Representation for Efficient Autonomous Driving
论文阅读
MhZhou04121 天前
Virtual Sparse Convolution for Multimodal 3D Object Detection 论文阅读
论文阅读
0x2111 天前
[论文阅读]Certifiably Robust RAG against Retrieval Corruption
论文阅读
何大春2 天前
【对话推荐系统综述】Broadening the View: Demonstration-augmented Prompt Learning for CR
论文阅读·人工智能·深度学习·语言模型·prompt·论文笔记
☞黑心萝卜三条杠☜2 天前
后门攻击仓库 backdoor attack
论文阅读·人工智能
FrancisQiu2 天前
LLM时代的小模型思考:《What is the Role of Small Models in the LLM Era: A Survey》论文笔记
论文阅读
带电的小王2 天前
Token:SentencePiece论文阅读--大模型中主流的分词算法
论文阅读·人工智能·算法·语言模型·大语言模型基础
Zhouqi_Hua3 天前
LLM论文笔记 19: On Limitations of the Transformer Architecture
论文阅读·人工智能·笔记·深度学习·语言模型·自然语言处理·transformer
栀子清茶3 天前
MobileMamba: Lightweight Multi-Receptive Visual Mamba Network——论文笔记
论文阅读
江木1236 天前
论文阅读和代码实现EfficientDet(BiFPN)
论文阅读