【PyTorch】图像分割

图像分割是什么

Image Segmentation

将图像每一个像素分类

图像分割分类

  1. 超像素分割:少量超像素代替大量像素,常用于图像预处理
  2. 语义分割:逐像素分类,无法区分个体
  3. 实例分割:对个体目标进行分割
  4. 全景分割:语义分割结合实例分割

本文讨论的是语义分割

模型如何完成图像分割

计算机:3-d张量 → 计算机:3-d张量

图像分割由模型与人类配合完成

模型:将数据映射 到特征

人类:定义特征的物理意义,解决实际问题

PyTorch-Hub

PyTorch模型库,有大量模型供开发者调用 Link

1.torch.hub.load('pytorch/vision', 'deeplabv3_resnet101',pretrained=True)

复制代码
model=torch.hub.load(github, model, *args, **kwargs)
功能:加载模型
主要参数:
- github:str, 项目名,eg:pytorch/vision,<repo_owner/repo_name[:tag_name]>
- model: str, 模型名

2.torch.hub.list(github, force_reload=False)

3.torch.hub.help(github, model, force_reload=False)

深度学习中的图像分割模型

FCN

Fully Convolutional Networks for Semantic Segmentation

最主要贡献:

利用全卷积完成pixelwise prediction

U-Net

U-Net: Convolutional Networks for Biomedical Image Segmentation

DeepLab系列

V1

Semantic Image Segmentation with Deep Convolutional Nets and Fully Connected CRFs

主要特点:

  1. 孔洞卷积:借助孔洞卷积,增大感受野
  2. CRF:采用CRF进行mask后处理

V2

DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs

主要特点:

  1. ASPP(Atrous Spatial Pyramid Pooling):解决多尺度问题

V3

Rethinking Atrous Convolution for Semantic Image Segmentation


主要特点:

  1. 孔洞卷积的串行
  2. ASPP的并行

V3+

Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation

主要特点:

deeplabv3基础上机上Encoder-Decoder思想

综述

Deep Semantic Segmentation of Natural and Medical Images: A Review

图像分割资源:

https://github.com/shawnbit/unet-family

https://github.com/yassouali/pytorch-segmentation

Unet实现人像抠图 (Portrait Matting)

数据来源:https://github.com/PetroWu/AutoPortraitMatting

未完待续......

相关推荐
Edward.W1 分钟前
如何制造一个AI Agent:从“人工智障”到“人工智能”的奇幻漂流
人工智能·制造
NingboWill8 分钟前
AI日报 - 2025年09月05日
人工智能·microsoft
SheldonChang9 分钟前
Onlyoffice集成与AI交互操作指引(Iframe版)
java·人工智能·ai·vue·onlyoffice·postmessage
云卓SKYDROID10 分钟前
无人机报警器8G信号技术解析
人工智能·无人机·航电系统·高科技·云卓科技
我是海飞17 分钟前
Tensorflow Lite 的yes/no语音识别音频预处理模型训练教程
python·学习·tensorflow·音视频·嵌入式·语音识别
音视频牛哥20 分钟前
具身智能的工程落地:视频-控制闭环的实践路径
人工智能·音视频·人工智能+·具身智能rtsp方案·具身智能rtmp方案·智能机器人rtsp方案·智能机器人rtmp低延迟
GEO_JYB23 分钟前
从 MMLU 到 HumanEval:为什么评估大型语言模型(LLM)的基准至关重要?
人工智能·算法
know__ledge24 分钟前
Python学习3.0使用Unittest框架运行测试用例
python·学习·测试用例
FutureUniant25 分钟前
GitHub每日最火火火项目(9.5)
人工智能·microsoft·计算机视觉·ai·github
视觉语言导航29 分钟前
ICCV-2025 | 清华动以知景导航框架!MTU3D:连接视觉定位与探索,实现高效多样的具身导航
人工智能·具身智能