【图像分割】【深度学习】Windows10下UNet代码Pytorch实现与源码讲解

【图像分割】【深度学习】Windows10下UNet代码Pytorch实现与源码讲解

提示:最近开始在【医学图像分割】方面进行研究,记录相关知识点,分享学习中遇到的问题已经解决的方法。


文章目录


前言

UNet是由德国弗赖堡大学的Olaf Ronneberger等人在《U-Net: Convolutional Networks for Biomedical Image Segmentation【MICCAI-2015】》【论文地址】一文中提出的U型编码和解码模型,即一个用于捕获上下文的收缩路径(编码器,下采样)和一个支持精确定位的对称扩展路径(解码器,上采样),并通过跳跃连接操作更好的融合浅层的位置信息和深层的语义信息。

在详细解析PFNet网络之前,首要任务是搭建UNet【Pytorch-demo地址】所需的运行环境,并完成模型训练和测试工作,展开后续工作才有意义。

数据预处理模块解析


UNet模型运行环境搭建

  • 查看主机支持的cuda版本(最高)

    bash 复制代码
    # 打开cmd,执行下面的指令查看CUDA版本号
    nvidia-smi
  • 安装GPU版本的torch【官网

    博主的cuda版本是12.2,但这里cuda版本最高也是12.1,博主选的11.8也没问题。

    其他cuda版本的torch在【以前版本】找对应的安装命令。

  • 博主安装环境参考

    bash 复制代码
    # 创建虚拟环境
    conda create -n UNet python=3.9
    # 查看新环境是否安装成功
    conda env list
    # 激活环境
    activate UNet
    # 分别安装pytorch和torchvision
    pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
    # 查看所有安装的包
    pip list
    conda list

UNet模型运行

数据集与模型权重下载

名称 下载地址 说明
DRIVE数据集 官网】【百度网盘:8no8】 用于眼科图像处理研究的公共数据集,用于血管分割任务
模型权重 百度网盘: p50a 使用U-Net在DRIVE数据集上训练得到的权重,仅供测试使用

将下载好的训练集解压并拷贝到当前工程目录下(建议)

将下载好的预训练权重(训练好的)best_model.pth拷贝到save_weights目录下(建议)。

PFNet训练与测试

  1. 训练:可以直接运行train.py,也可以根据硬件条件修改代码中部分训练参数epochs和batch-size修改训练次数和训练的batchsize等,详细的代码内容将在后续博文中介绍。

    正在训练,训练权重保存在save_weights目录下:

  2. 测试:可以直接运行predict.py,也可以根据任务需求修改代码中部分变量img_path和roi_mask_path等,选择测试的图片。

    对于DRIVE数据集img_path和roi_mask_path必须同时给定且一一对应,其他数据集以及个人数据集的训练和测试,博主会在后续的内容中给出修改后的代码。

    测试结果保存为当前工程目录下的test_result.png,可以对比查看效果:


总结

尽可能简单、详细的介绍了UNet的安装流程以及UNet的使用方法。后续会根据自己学到的知识结合个人理解讲解UNet的原理和代码。

相关推荐
猫先生Mr.Mao1 分钟前
2025年3月AGI技术月评|技术突破重构数字世界底层逻辑
人工智能·aigc·大语言模型·agi·多模态·行业洞察
什么芮.12 分钟前
spark-streaming
pytorch·sql·spark·kafka·scala
睿创咨询19 分钟前
科技与商业动态简报
人工智能·科技·ipd·商业
科技在线19 分钟前
科技赋能建筑新未来:中建海龙模块化建筑产品入选中国建筑首批产业化推广产品
大数据·人工智能
HED29 分钟前
用扣子快速手撸人生中第一个AI智能应用!
前端·人工智能
极小狐31 分钟前
极狐GitLab 如何 cherry-pick 变更?
人工智能·git·机器学习·gitlab
小宋加油啊33 分钟前
深度学习小记(包括pytorch 还有一些神经网络架构)
pytorch·深度学习·神经网络
沛沛老爹36 分钟前
从线性到非线性:简单聊聊神经网络的常见三大激活函数
人工智能·深度学习·神经网络·激活函数·relu·sigmoid·tanh
0x2111 小时前
[论文阅读]ReAct: Synergizing Reasoning and Acting in Language Models
人工智能·语言模型·自然语言处理
何大春1 小时前
【视频时刻检索】Text-Video Retrieval via Multi-Modal Hypergraph Networks 论文阅读
论文阅读·深度学习·神经网络·计算机视觉·视觉检测·论文笔记