解决python bug(关于Paddle分布式训练):Exit with signal X

解决python bug[关于Paddle分布式训练]:Exit with signal X

Exit with signal X

  • 后来通过查询相关资料得知,引发这个bug的原因是当前使用的服务器为单卡,不是多卡,而代码中调用的是多卡分布式训练方式,所以会引发报错,一种解决方案是将多卡分布式训练转为单卡训练。由于这里使用的是百度的Paddle框架,所以其他框架可能并不适用哈!

多卡训练(需根据自己需求进行更改)

python 复制代码
python -m paddle.distributed.launch --log_dir=./mcfairmot_dla34_30e_1088x608_visdrone_vehicle_bytetracker/  --gpus 0 ./PaddleDetection/tools/train.py -c ./PaddleDetection/configs/mot/mcfairmot/mcfairmot_dla34_30e_1088x608_visdrone_vehicle_bytetracker.yml

单卡训练(需根据自己需求进行更改)

python 复制代码
python ./PaddleDetection/tools/train.py -c ./PaddleDetection/configs/mot/mcfairmot/mcfairmot_dla34_30e_1088x608_visdrone_vehicle_bytetracker.yml

将多卡分布式训练命令转为单卡训练命令,bug就解决啦!!!

相关推荐
那个村的李富贵8 分钟前
昇腾CANN跨行业实战:五大新领域AI落地案例深度解析
人工智能·aigc·cann
集简云-软件连接神器11 分钟前
技术实战:集简云语聚AI实现小红书私信接入AI大模型全流程解析
人工智能·小红书·ai客服
松☆11 分钟前
深入理解CANN:面向AI加速的异构计算架构
人工智能·架构
rainbow72424411 分钟前
无基础学AI的入门核心,从基础工具和理论开始学
人工智能
lxs-12 分钟前
CANN计算机视觉算子库ops-cv全面解析:图像处理与目标检测的高性能引擎
图像处理·目标检测·计算机视觉
0思必得015 分钟前
[Web自动化] Selenium处理滚动条
前端·爬虫·python·selenium·自动化
子榆.16 分钟前
CANN 与主流 AI 框架集成:从 PyTorch/TensorFlow 到高效推理的无缝迁移指南
人工智能·pytorch·tensorflow
七月稻草人17 分钟前
CANN生态ops-nn:AIGC的神经网络算子加速内核
人工智能·神经网络·aigc
2501_9248787317 分钟前
数据智能驱动进化:AdAgent 多触点归因与自我学习机制详解
人工智能·逻辑回归·动态规划
芷栀夏19 分钟前
CANN开源实战:基于DrissionPage构建企业级网页自动化与数据采集系统
运维·人工智能·开源·自动化·cann