github深度学习项目复现教程

如何找感兴趣的项目？

使用github或papers with code搜索关键词"deep learning"等，最受欢迎的是stars数最多的

查看readme

是否清晰地描述了项目目标、使用的技术、安装步骤和运行方法

是否包含依赖项、所需数据集和训练模型等信息

1、准备环境

如果是租用gpu服务器，可以直接选好拥有对应环境的服务器，就不用再新建虚拟环境占用空间了（服务器ssh登录vscode时，如果连接不上，可能是因为配置文件里已经有了相同服务器的记录，要把它注释掉，再连接）

（1）克隆项目到本地

终端输入：git clone 项目url（克隆到当前文件夹下）

或者下载zip解压缩，再用vscode打开

推荐使用git clone，下载的是完整的仓库，可以自动检查更新和完整性（如部分文件已经下载，重新克隆时会判断是否需要更新这些文件），而zip只是一个静态文件包

（2）创建并激活环境

conda create -n unet python=3.9

conda activate unet

复制代码

conda install pytorch torchvision torchaudio pytorch-cuda=11.8 -c pytorch -c nvidia

（pytorch官网找到对应的torch版本的下载命令，服务器拥有的cuda是12.2，所以下载命令使用的版本不能超过12.2）

（3）安装依赖项

requirments.txt或environment.yml

pip install -r requirments.txt （-r表示read，读取文件）

使用envirment.yml时，

在上一步创建环境的时候这样写conda env create -n myenv --file environment.yml

如果没有依赖文件，就自己去要运行的文件（dataset.py，main.py）里找需要什么依赖，再一个个安装，或者根据它的报错提示来补充安装

2、准备数据

下载数据集到指定文件夹

检查数据集格式，是否需要预处理或格式转换

3、配置和运行项目

（1）仔细阅读配置说明，修改配置文件（config.json或.yaml）

（2）运行项目

比如：pythonn train.py（运行脚本）

可能会报错，需要解决潜在问题

比如这个例子，我们需要把dataset.py里的数据集路径更改成自己的（注意可能有多次出现哦，就要改动很多处）

然后是输入命令python main.py，--action这些是参数，在main.py里可以看到；注意如果不指定--dataset，就会使用default数据集，这里default是liver数据集，如果liver数据集不存在，就会出现ZeroDivisionError: division by zero这样的错误。所以必须指定好数据集。

还要注意此时要进入mian.py所在的目录下，才能找到并执行这个文件

4、检查输出并评估

查看输出（训练日志、生成的模型或可视化结果）

进行评估（有的项目会提供评估脚本或方法）

比较结果（和文档中的参考结果作比较，看是否一致）