加载GPT-2模型参数报错:TensorFlow不存在

【1】下载OpenAI通过TensorFlow保存的GPT-2模型权重

python 复制代码
import urllib.request

# 下载OpenAI通过TensorFlow保存的GPT-2模型权重
# print("\n step1:下载gpt-download.py")
# url = "https://raw.githubusercontent.com/rasbt/LLMs-from-scratch/main/ch05/01_main-chapter-code/gpt_download.py"
# filename = url.split("/")[-1]
# urllib.request.urlretrieve(url, filename)

【2】从gpt-download.py中 导入 download_and_load_gpt2函数

复制代码
执行上述代码-download_and_load_gpt2 函数, 将下载参数量为1.24亿的GPT-2模型的7个文件;
python 复制代码
# 从gpt-download.py中 导入 download_and_load_gpt2函数
print("\n step2:使用 download_and_load_gpt2函数 加载gpt-2架构设置和权重参数到python会话中")
settings, params = download_and_load_gpt2(
    model_size="124M", models_dir="gpt2"
)
# 执行上述代码-download_and_load_gpt2 函数, 将下载参数量为1.24亿的GPT-2模型的7个文件
print("\n=== 执行上述代码-download_and_load_gpt2函数, 将下载参数量为1.24亿的GPT-2模型的7个文件,, 下载完成")

【报错信息】


【3】安装tensorflow

TensorFlow ImportError: DLL load failed: 动态链接库(DLL)初始化例程失败 问题解决_tensorflow dll load failed-CSDN博客

由上述博文可知,tensorflow1.5版本可以在老cpu上运行,而大于1.5的版本需要cpu支持AVX指令集,因此无法在不支持AVX指令集的cpu上运行。

所以安装tensorfflow1.5

【3.1】安装tensorfflow1.5报错

解决tensorflow的 ImportError: DLL load failed: 动态链接库(DLL)初始化例程失败_动态链接库dll初始化例程失败-CSDN博客

【3.2】使用conda安装tensorflow1.5

参考:

解决tensorflow ==1.15安装不上的问题_pip instrall tensorflow==1.15.2-CSDN博客

cpp 复制代码
conda create -n myenv python=3.7  #创建环境
conda activate myenv
python -m pip install tensorflow==1.15.0

接着我们需要安装conda;


【4】安装conda

conda定义:Conda 是一个开源的 包管理环境管理 工具,主要用于 Python 生态,但也支持其他语言(如 R、Java 等)。它由 Anaconda 公司开发,广泛应用于数据科学、机器学习、科学计算等领域。

【4.1】Pycharm 安装anaconda

参考: PyCharm与Anaconda超详细安装配置教程_anaconda pycharm安装-CSDN博客

相关推荐
小鸡吃米…3 小时前
机器学习 - K - 中心聚类
人工智能·机器学习·聚类
好奇龙猫4 小时前
【AI学习-comfyUI学习-第三十节-第三十一节-FLUX-SD放大工作流+FLUX图生图工作流-各个部分学习】
人工智能·学习
沈浩(种子思维作者)4 小时前
真的能精准医疗吗?癌症能提前发现吗?
人工智能·python·网络安全·健康医疗·量子计算
minhuan4 小时前
大模型应用:大模型越大越好?模型参数量与效果的边际效益分析.51
人工智能·大模型参数评估·边际效益分析·大模型参数选择
Cherry的跨界思维4 小时前
28、AI测试环境搭建与全栈工具实战:从本地到云平台的完整指南
java·人工智能·vue3·ai测试·ai全栈·测试全栈·ai测试全栈
MM_MS4 小时前
Halcon变量控制类型、数据类型转换、字符串格式化、元组操作
开发语言·人工智能·深度学习·算法·目标检测·计算机视觉·视觉检测
ASF1231415sd4 小时前
【基于YOLOv10n-CSP-PTB的大豆花朵检测与识别系统详解】
人工智能·yolo·目标跟踪
水如烟5 小时前
孤能子视角:“意识“的阶段性回顾,“感质“假说
人工智能
Carl_奕然5 小时前
【数据挖掘】数据挖掘必会技能之:A/B测试
人工智能·python·数据挖掘·数据分析
旅途中的宽~5 小时前
《European Radiology》:2024血管瘤分割—基于MRI T1序列的分割算法
人工智能·计算机视觉·mri·sci一区top·血管瘤·t1