【PyTorch】图像分割

图像分割是什么

Image Segmentation

将图像每一个像素分类

图像分割分类

  1. 超像素分割:少量超像素代替大量像素,常用于图像预处理
  2. 语义分割:逐像素分类,无法区分个体
  3. 实例分割:对个体目标进行分割
  4. 全景分割:语义分割结合实例分割

本文讨论的是语义分割

模型如何完成图像分割

计算机:3-d张量 → 计算机:3-d张量

图像分割由模型与人类配合完成

模型:将数据映射 到特征

人类:定义特征的物理意义,解决实际问题

PyTorch-Hub

PyTorch模型库,有大量模型供开发者调用 Link

1.torch.hub.load('pytorch/vision', 'deeplabv3_resnet101',pretrained=True)

复制代码
model=torch.hub.load(github, model, *args, **kwargs)
功能:加载模型
主要参数:
- github:str, 项目名,eg:pytorch/vision,<repo_owner/repo_name[:tag_name]>
- model: str, 模型名

2.torch.hub.list(github, force_reload=False)

3.torch.hub.help(github, model, force_reload=False)

深度学习中的图像分割模型

FCN

Fully Convolutional Networks for Semantic Segmentation

最主要贡献:

利用全卷积完成pixelwise prediction

U-Net

U-Net: Convolutional Networks for Biomedical Image Segmentation

DeepLab系列

V1

Semantic Image Segmentation with Deep Convolutional Nets and Fully Connected CRFs

主要特点:

  1. 孔洞卷积:借助孔洞卷积,增大感受野
  2. CRF:采用CRF进行mask后处理

V2

DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs

主要特点:

  1. ASPP(Atrous Spatial Pyramid Pooling):解决多尺度问题

V3

Rethinking Atrous Convolution for Semantic Image Segmentation


主要特点:

  1. 孔洞卷积的串行
  2. ASPP的并行

V3+

Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation

主要特点:

deeplabv3基础上机上Encoder-Decoder思想

综述

Deep Semantic Segmentation of Natural and Medical Images: A Review

图像分割资源:

https://github.com/shawnbit/unet-family

https://github.com/yassouali/pytorch-segmentation

Unet实现人像抠图 (Portrait Matting)

数据来源:https://github.com/PetroWu/AutoPortraitMatting

未完待续......

相关推荐
七牛云行业应用几秒前
GPT-5.5 Instant vs Grok 4 完整对比【2026年5月最新】:哪个大模型更适合开发者?
人工智能·docker·github·ai实战·大模型部署·claude opus 4.7·api接入
大龄码农有梦想2 分钟前
单智能体编排 vs 多智能体协作:AI应用开发技术路线之争
人工智能·dify·langgraph·工作流编排·crewai·单智能体编排·多智能体协助
HIT_Weston2 分钟前
78、【Agent】【OpenCode】bash 工具提示词(持久化)(二)
人工智能·agent·opencode
HIT_Weston4 分钟前
77、【Agent】【OpenCode】bash 工具提示词(持久化)(一)
人工智能·agent·opencode
j_xxx404_5 分钟前
Linux共享内存原理与实战:从内核到C++实现|附源码
linux·运维·开发语言·c++·人工智能
无敌的六边形狗勾战士6 分钟前
重温DIRE:走向通用人工智能生成的图像检测
人工智能
专注VB编程开发20年7 分钟前
在 Python 中使用 comtypes 时,大小写通常必须保持精确
python·excel
云天AI实战派12 分钟前
ChatGPT / Realtime API / 智能体故障排查指南:语音模型、浏览器会话与权限问题全流程解决方案
人工智能·chatgpt
agicall.com13 分钟前
信电助 - 信创坐席盒 UB-B-XC 型号功能列表
人工智能·语音识别·信创电话助手·座机语音转文字·固话录音转文字
金玉满堂@bj15 分钟前
Python 后端开发 从零到就业完整教程(2026 企业级完整版)
开发语言·python