文章目录
-
- [踩坑1 Tensorflow找不到GPU:tensorflow 2.11.0版本开始,在windows上不再支持GPU](#踩坑1 Tensorflow找不到GPU:tensorflow 2.11.0版本开始,在windows上不再支持GPU)
- [踩坑2 解决zlibwapi.dll缺失问题](#踩坑2 解决zlibwapi.dll缺失问题)
- [3 完整下载过程:(除去踩坑1和踩坑2,无坑版本)](#3 完整下载过程:(除去踩坑1和踩坑2,无坑版本))
-
- [因为windows只支持2.10.0,所以这里我们用2.10.0。但CUDA Toolkit: 11.8、cuDNN: 8.6按照此版本下载,完全可行。亲测无坑!!](#因为windows只支持2.10.0,所以这里我们用2.10.0。但CUDA Toolkit: 11.8、cuDNN: 8.6按照此版本下载,完全可行。亲测无坑!!)
踩坑1 Tensorflow找不到GPU:tensorflow 2.11.0版本开始,在windows上不再支持GPU
- 因此如果使用的是windows系统,需要注意tensorflow版本为最高2.10.0
bash
# 1. 完全卸载TensorFlow
pip uninstall tensorflow -y
# 2. 清理pip缓存(避免安装损坏文件)
pip cache purge
# 3. 重新安装TensorFlow 2.10.0(指定镜像源,确保完整安装)
pip install tensorflow==2.10.0
踩坑2 解决zlibwapi.dll缺失问题


将 zlibwapi.lib 文件放到 path/to/Program Files/NVIDIA GPU Computing Toolkit/CUDA/v11.8/lib 下
将 zlibwapi.dll 文件放到 path/to/Program Files/NVIDIA GPU Computing Toolkit/CUDA/v11.8/bin 下
ps:此文件夹可以在网上找到,亲测有效
3 完整下载过程:(除去踩坑1和踩坑2,无坑版本)
你现在用的是 TensorFlow 2.15.0,那我立刻给你匹配这个版本的 GPU 环境配置方案,避免版本不兼容的问题。
TensorFlow 2.15.0 对应的 GPU 依赖(官方标准)
TensorFlow 2.15.0 官方要求的依赖版本是:
CUDA Toolkit: 11.8
cuDNN: 8.6
NVIDIA 显卡驱动: ≥ 520.61.05
正确安装步骤(适配 TensorFlow 2.15.0)
因为windows只支持2.10.0,所以这里我们用2.10.0。但CUDA Toolkit: 11.8、cuDNN: 8.6按照此版本下载,完全可行。亲测无坑!!
- 第一步:卸载错误的 CUDA 版本(如果已装 12.9)
打开「控制面板 → 程序和功能」
卸载所有包含「NVIDIA CUDA」的程序(比如「NVIDIA CUDA 12.9 Toolkit」)
重启电脑 - 第二步:安装 CUDA 11.8(适配 TF 2.15.0)
下载 CUDA 11.8.0:https://developer.nvidia.com/cuda-11-8-0-download-archive
选择:Windows → x86_64 → 10/11 → exe (local)
安装时选「自定义安装」:
取消勾选「NVIDIA GeForce Experience」「Display Driver」(保留现有显卡驱动,避免冲突)
只勾选「CUDA → Runtime」(核心组件)
安装路径默认即可(C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.8) - 第三步:安装 cuDNN 8.6.0 for CUDA 11.8
下载 cuDNN 8.6.0:https://developer.nvidia.com/rdp/cudnn-archive#version-860
选择「cuDNN v8.6.0 (October 3rd, 2022), for CUDA 11.x」
下载 Windows 版本(需登录 NVIDIA 账号,免费注册即可)
解压下载的压缩包,得到bin、include、lib三个文件夹
将这三个文件夹复制粘贴到 CUDA 11.8 的安装目录(C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.8),覆盖同名文件夹(确认合并,不删除原有文件) - 第四步:配置环境变量(关键)
手动添加以下路径到系统PATH(右键「此电脑 → 属性 → 高级系统设置 → 环境变量 → 系统变量 → PATH」):
bash
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.8\bin
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.8\lib\x64
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.8\include
重启电脑,让环境变量有效
环境变量测试命令如下(在cmd中打开)
bash
# 检查PATH里是否有CUDA路径
echo %PATH% | findstr "CUDA"
# 检查cuDNN的dll文件
dir "C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.8\bin\cudnn64_8.dll"


- 第五步:重装 TensorFlow 2.15.0 GPU 版
bash
conda activate fedrffi
pip uninstall tensorflow -y
pip install tensorflow==2.10.0
第六步:验证 GPU 是否识别
bash
import os
import tensorflow as tf
# 强制启用GPU,关闭不必要的警告
os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'
os.environ['CUDA_VISIBLE_DEVICES'] = '0'
os.environ['TF_FORCE_GPU_ALLOW_GROWTH'] = 'true'
# 打印关键信息
print(f"TensorFlow 版本: {tf.__version__}")
print(f"CUDA 可用: {tf.test.is_built_with_cuda()}")
print(f"GPU 设备列表: {tf.config.list_physical_devices('GPU')}")
# 验证GPU是否能实际计算
if tf.config.list_physical_devices('GPU'):
print("\n✅ GPU配置全部成功!开始测试GPU计算...")
with tf.device('/GPU:0'):
# 创建大矩阵测试GPU计算(能明显看到GPU利用率上升)
a = tf.random.normal((5000, 5000))
b = tf.random.normal((5000, 5000))
c = tf.matmul(a, b)
print(f"GPU计算完成!结果矩阵形状: {c.shape}")
# 把这段配置加到你的main.py开头,即可用GPU训练LoRa模型
print("\n✅ 现在运行你的main.py,就能使用GPU训练了!")
else:
print("\n❌ 仍未识别GPU,仅需检查最后1点:")
print("1. 你的显卡是否是NVIDIA(AMD/集成显卡不支持)")
print("2. 显卡驱动版本是否≥520.61.05(更新驱动:https://www.nvidia.com/Download/index.aspx)")