解决python bug(关于Paddle分布式训练):Exit with signal X

解决python bug[关于Paddle分布式训练]:Exit with signal X

Exit with signal X

  • 后来通过查询相关资料得知,引发这个bug的原因是当前使用的服务器为单卡,不是多卡,而代码中调用的是多卡分布式训练方式,所以会引发报错,一种解决方案是将多卡分布式训练转为单卡训练。由于这里使用的是百度的Paddle框架,所以其他框架可能并不适用哈!

多卡训练(需根据自己需求进行更改)

python 复制代码
python -m paddle.distributed.launch --log_dir=./mcfairmot_dla34_30e_1088x608_visdrone_vehicle_bytetracker/  --gpus 0 ./PaddleDetection/tools/train.py -c ./PaddleDetection/configs/mot/mcfairmot/mcfairmot_dla34_30e_1088x608_visdrone_vehicle_bytetracker.yml

单卡训练(需根据自己需求进行更改)

python 复制代码
python ./PaddleDetection/tools/train.py -c ./PaddleDetection/configs/mot/mcfairmot/mcfairmot_dla34_30e_1088x608_visdrone_vehicle_bytetracker.yml

将多卡分布式训练命令转为单卡训练命令,bug就解决啦!!!

相关推荐
NAGNIP5 小时前
一文搞懂深度学习中的通用逼近定理!
人工智能·算法·面试
冬奇Lab6 小时前
一天一个开源项目(第36篇):EverMemOS - 跨 LLM 与平台的长时记忆 OS,让 Agent 会记忆更会推理
人工智能·开源·资讯
冬奇Lab6 小时前
OpenClaw 源码深度解析(一):Gateway——为什么需要一个"中枢"
人工智能·开源·源码阅读
AngelPP10 小时前
OpenClaw 架构深度解析:如何把 AI 助手搬到你的个人设备上
人工智能
宅小年10 小时前
Claude Code 换成了Kimi K2.5后,我再也回不去了
人工智能·ai编程·claude
AI探索者10 小时前
LangGraph StateGraph 实战:状态机聊天机器人构建指南
python
AI探索者10 小时前
LangGraph 入门:构建带记忆功能的天气查询 Agent
python
九狼10 小时前
Flutter URL Scheme 跨平台跳转
人工智能·flutter·github
ZFSS10 小时前
Kimi Chat Completion API 申请及使用
前端·人工智能
天翼云开发者社区11 小时前
春节复工福利就位!天翼云息壤2500万Tokens免费送,全品类大模型一键畅玩!
人工智能·算力服务·息壤