github深度学习项目复现教程

如何找感兴趣的项目?

使用github或papers with code搜索关键词"deep learning"等,最受欢迎的是stars数最多的

查看readme

是否清晰地描述了项目目标、使用的技术、安装步骤和运行方法

是否包含依赖项、所需数据集和训练模型等信息

1、准备环境

如果是租用gpu服务器,可以直接选好拥有对应环境的服务器,就不用再新建虚拟环境占用空间了(服务器ssh登录vscode时,如果连接不上,可能是因为配置文件里已经有了相同服务器的记录,要把它注释掉,再连接)

(1)克隆项目到本地

终端输入:git clone 项目url(克隆到当前文件夹下)

或者下载zip解压缩,再用vscode打开

推荐使用git clone,下载的是完整的仓库,可以自动检查更新和完整性(如部分文件已经下载,重新克隆时会判断是否需要更新这些文件),而zip只是一个静态文件包

(2)创建并激活环境

conda create -n unet python=3.9

conda activate unet

复制代码
conda install pytorch torchvision torchaudio pytorch-cuda=11.8 -c pytorch -c nvidia

(pytorch官网找到对应的torch版本的下载命令,服务器拥有的cuda是12.2,所以下载命令使用的版本不能超过12.2)

(3)安装依赖项

requirments.txt或environment.yml

pip install -r requirments.txt (-r表示read,读取文件)

使用envirment.yml时,

在上一步创建环境的时候这样写conda env create -n myenv --file environment.yml

如果没有依赖文件,就自己去要运行的文件(dataset.pymain.py)里找需要什么依赖,再一个个安装,或者根据它的报错提示来补充安装

2、准备数据

下载数据集到指定文件夹

检查数据集格式,是否需要预处理或格式转换

3、配置和运行项目

(1)仔细阅读配置说明,修改配置文件(config.json或.yaml)

(2)运行项目

比如:pythonn train.py(运行脚本)

可能会报错,需要解决潜在问题

比如这个例子,我们需要把dataset.py里的数据集路径更改成自己的(注意可能有多次出现哦,就要改动很多处)

然后是输入命令python main.py,--action这些是参数,在main.py里可以看到;注意如果不指定--dataset,就会使用default数据集,这里default是liver数据集,如果liver数据集不存在,就会出现ZeroDivisionError: division by zero这样的错误。所以必须指定好数据集。

还要注意此时要进入mian.py所在的目录下,才能找到并执行这个文件

4、检查输出并评估

查看输出(训练日志、生成的模型或可视化结果)

进行评估(有的项目会提供评估脚本或方法)

比较结果(和文档中的参考结果作比较,看是否一致)

相关推荐
中科三方13 小时前
详细教程:两个域名指向同一个网站,怎么设置域名解析?
github·dns
第一程序员15 小时前
Python与前端集成:构建全栈应用
python·github
子兮曰16 小时前
CLI正在吞掉GUI:不是替代,是统治,AI时代的入口争夺战
人工智能·github·命令行
蚂蚁集团分布式架构18 小时前
🦐 不办 Meetup,开挑战赛!SOFAStack PR Challenge | SOFAStack 8 周年
后端·github·claude
逛逛GitHub20 小时前
13 万星的 GitHub 神器让 GLM-5.1 直接起飞,3 天烧了 1 亿 Token。
github
攀登的牵牛花20 小时前
本周 GitHub 趋势观察:为什么前端热榜越来越像“AI 工具市场”?
前端·github
第一程序员20 小时前
Python游戏开发:从入门到实践
python·github
殷紫川21 小时前
IDEA 集成 GitHub Copilot 指南:解锁 10 倍编码效率的全链路实战
github·intellij idea·github copilot
八号老王1 天前
Google Cloud Vertex AI 接入 OpenClaw 记录
github
子兮曰1 天前
同样做中文平台自动化:为什么你越跑越贵,而 OpenCLI 越跑越稳
前端·github·命令行