常规文件
生成launch.json
正对不同的文件用不同的configurations
python 文件.py 如果后面添加很多参数的话 需要直接添加到该
launch.json中
指定显卡在env中
CUDA_VISIBLE
arg是文件后面跟的参数
name用于区分不同文件debug配置
program是不同的文件路径
在导入包里的文件夹
改参数justmycode : false
查看变量信息
调试控制台里 用tap补全
torchrun debug
有的时候时torchrun
单机多卡 ddp
deepspeed训练debuger
其中的 --deepspeed是内置在TrainingArguments中必须要导入包才行
还有用第一种方法的时候老师报错name 'true' is not defined
看了半天以为是版本不匹配 false 要大写结果是在用python debugger调试json文件