深度学习Tensorflow: CUDA_ERROR_OUT_OF_MEMORY解决办法

目前在用深度学习训练,训练中设置batch size后可以正常跑通,但是在训练一轮save_model时,总出现这个错误,即使我调batch size到1也依旧会报错。

发现是在 调用logger时出现问题。

查询后了解到是因为TensorFlow中的eager_execution默认调用最大GPU(但我的GPU显存不足以满足需求,所以报错)。经过查询,再logger.py调用tf处,加入

python 复制代码
    os.environ["CUDA_VISIBLE_DEVICES"]="1" #选择你使用的GPU
 
    tf.compat.v1.disable_eager_execution() #禁用_eager_execution
    config=tf.compat.v1.ConfigProto()
    config.gpu_options.per_process_gpu_memory_fraction = 0.9 #阈值,TensorFlow 会话在执行时最多占用 90% 的 GPU 显存。
    sess=tf.compat.v1.Session(config=config) # 创建一个 TensorFlow 会话 sess,并传入配置对象 config。这样会话就会按照指定的配置创建和执行。

随后解决问题。

相关推荐
CanCanCanedFish1 分钟前
快速解决OpenCode配置第三方API
人工智能·ai
波动几何5 分钟前
IntelGrid — 9 层工具架构的 AI Agent 框架
人工智能
lcjt7 分钟前
RTX5060+ubuntu22.04尝试宇树G1踩坑
人工智能
DO_Community11 分钟前
DigitalOcean 收购 Katanemo Labs:迎接 Agent 时代,重塑基础设施
人工智能·ai推理
kingcjh9719 分钟前
2.1 vLLM-Omni + Wan2.1-T2V-1.3B测试数据
深度学习
NOCSAH20 分钟前
生产大屏与统计报表:数智一体化平台如何实现工厂管理
人工智能·信息可视化·数智化一体平台·统好ai
BlockWay24 分钟前
从展台到策略执行:WEEX 在 NBX2026 展示 AI 真实应用场景
大数据·人工智能
zhongerzixunshi36 分钟前
一篇文章全面了解智能制造能力成熟度标准CMMM符合性评估
大数据·人工智能·制造
no245441037 分钟前
深度解析:WebP会在几年内取代JPG吗?
java·大数据·人工智能·科技·ai
龙文浩_39 分钟前
AI深度学习中的张量计算理论与实践
人工智能·神经网络