解决python bug(关于Paddle分布式训练):Exit with signal X

解决python bug[关于Paddle分布式训练]:Exit with signal X

Exit with signal X

  • 后来通过查询相关资料得知,引发这个bug的原因是当前使用的服务器为单卡,不是多卡,而代码中调用的是多卡分布式训练方式,所以会引发报错,一种解决方案是将多卡分布式训练转为单卡训练。由于这里使用的是百度的Paddle框架,所以其他框架可能并不适用哈!

多卡训练(需根据自己需求进行更改)

python 复制代码
python -m paddle.distributed.launch --log_dir=./mcfairmot_dla34_30e_1088x608_visdrone_vehicle_bytetracker/  --gpus 0 ./PaddleDetection/tools/train.py -c ./PaddleDetection/configs/mot/mcfairmot/mcfairmot_dla34_30e_1088x608_visdrone_vehicle_bytetracker.yml

单卡训练(需根据自己需求进行更改)

python 复制代码
python ./PaddleDetection/tools/train.py -c ./PaddleDetection/configs/mot/mcfairmot/mcfairmot_dla34_30e_1088x608_visdrone_vehicle_bytetracker.yml

将多卡分布式训练命令转为单卡训练命令,bug就解决啦!!!

相关推荐
TDengine (老段)4 分钟前
TDengine Python 连接器入门指南
大数据·数据库·python·物联网·时序数据库·tdengine·涛思数据
亚里随笔5 分钟前
GenEnv:让AI智能体像人一样在_游戏_中成长
人工智能·游戏·llm·rl·agentic
少林码僧14 分钟前
2.29 XGBoost、LightGBM、CatBoost对比:三大梯度提升框架选型指南
人工智能·机器学习·ai·数据挖掘·数据分析·回归
喝拿铁写前端16 分钟前
当 AI 会写代码之后,我们应该怎么“管”它?
前端·人工智能
春日见18 分钟前
控制算法:PP(纯跟踪)算法
linux·人工智能·驱动开发·算法·机器学习
沫儿笙27 分钟前
ABB焊接机器人混合气体节气方案
人工智能·机器人
田里的水稻29 分钟前
C++_python_相互之间的包含调用方法
c++·chrome·python
余俊晖29 分钟前
多页文档理解强化学习设计思路:DocR1奖励函数设计与数据构建思路
人工智能·语言模型·自然语言处理
Yeats_Liao32 分钟前
MindSpore开发之路(二十六):系列总结与学习路径展望
人工智能·深度学习·学习·机器学习
2501_9418705634 分钟前
面向微服务熔断与流量削峰策略的互联网系统稳定性设计与多语言工程实践分享
开发语言·python