解决python bug(关于Paddle分布式训练):Exit with signal X

解决python bug[关于Paddle分布式训练]:Exit with signal X

Exit with signal X

  • 后来通过查询相关资料得知,引发这个bug的原因是当前使用的服务器为单卡,不是多卡,而代码中调用的是多卡分布式训练方式,所以会引发报错,一种解决方案是将多卡分布式训练转为单卡训练。由于这里使用的是百度的Paddle框架,所以其他框架可能并不适用哈!

多卡训练(需根据自己需求进行更改)

python 复制代码
python -m paddle.distributed.launch --log_dir=./mcfairmot_dla34_30e_1088x608_visdrone_vehicle_bytetracker/  --gpus 0 ./PaddleDetection/tools/train.py -c ./PaddleDetection/configs/mot/mcfairmot/mcfairmot_dla34_30e_1088x608_visdrone_vehicle_bytetracker.yml

单卡训练(需根据自己需求进行更改)

python 复制代码
python ./PaddleDetection/tools/train.py -c ./PaddleDetection/configs/mot/mcfairmot/mcfairmot_dla34_30e_1088x608_visdrone_vehicle_bytetracker.yml

将多卡分布式训练命令转为单卡训练命令,bug就解决啦!!!

相关推荐
美狐美颜sdk1 小时前
跨平台直播美颜SDK集成实录:Android/iOS如何适配贴纸功能
android·人工智能·ios·架构·音视频·美颜sdk·第三方美颜sdk
DeepSeek-大模型系统教程1 小时前
推荐 7 个本周 yyds 的 GitHub 项目。
人工智能·ai·语言模型·大模型·github·ai大模型·大模型学习
有Li1 小时前
通过具有一致性嵌入的大语言模型实现端到端乳腺癌放射治疗计划制定|文献速递-最新论文分享
论文阅读·深度学习·分类·医学生
郭庆汝1 小时前
pytorch、torchvision与python版本对应关系
人工智能·pytorch·python
IT古董1 小时前
【第二章:机器学习与神经网络概述】03.类算法理论与实践-(3)决策树分类器
神经网络·算法·机器学习
小雷FansUnion3 小时前
深入理解MCP架构:智能服务编排、上下文管理与动态路由实战
人工智能·架构·大模型·mcp
资讯分享周3 小时前
扣子空间PPT生产力升级:AI智能生成与多模态创作新时代
人工智能·powerpoint
思则变4 小时前
[Pytest] [Part 2]增加 log功能
开发语言·python·pytest
叶子爱分享4 小时前
计算机视觉与图像处理的关系
图像处理·人工智能·计算机视觉
鱼摆摆拜拜4 小时前
第 3 章:神经网络如何学习
人工智能·神经网络·学习