nanoGPT 部署

NanoGPT 是由 Andrej Karpathy(前特斯拉 AI 总监)开源的一个 极简版 GPT(Generative Pre-trained Transformer)实现

它的目标不是直接用于大规模商业应用,而是 教育、研究和实验,帮助人们理解 GPT 模型的核心原理。

特点:

  • 代码简洁、结构清晰,便于阅读。

  • 模型规模小,适合在个人电脑上训练和测试。

  • 使用 PyTorch 实现,方便修改和扩展。

Github 地址:https://github.com/karpathy/nanoGPT#


  1. 使用 Anaconda 创建 python 虚拟环境

    conda create --prefix D:\conda_envs\nanoGPT python=3.9

--prefix:指定虚拟环境安装的位置

我的电脑是 RTX5060 CUDA12.8,下载如下版本的 pytorch

复制代码
pip3 install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/cu128
或 Anaconda Prompt 中运行:python -m pip install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/cu128

安装代码的相关依赖

复制代码
pip install  tiktoken 
  1. 拉取代码

    git clone https://github.com/karpathy/nanoGPT.git

  2. 运行

    python data/shakespeare_char/prepare.py

在 config/train_shakespeare_char.py 文件中加上 compile = False,再运行

复制代码
python train.py config/train_shakespeare_char.py

python sample.py --out_dir=out-shakespeare-char
复制代码
相关推荐
0思必得01 小时前
[Web自动化] Selenium处理动态网页
前端·爬虫·python·selenium·自动化
韩立学长1 小时前
【开题答辩实录分享】以《基于Python的大学超市仓储信息管理系统的设计与实现》为例进行选题答辩实录分享
开发语言·python
大山同学1 小时前
图片补全-Context Encoder
人工智能·机器学习·计算机视觉
qq_192779871 小时前
高级爬虫技巧:处理JavaScript渲染(Selenium)
jvm·数据库·python
薛定谔的猫19821 小时前
十七、用 GPT2 中文对联模型实现经典上联自动对下联:
人工智能·深度学习·gpt2·大模型 训练 调优
u0109272711 小时前
使用Plotly创建交互式图表
jvm·数据库·python
爱学习的阿磊1 小时前
Python GUI开发:Tkinter入门教程
jvm·数据库·python
Imm7772 小时前
中国知名的车膜品牌推荐几家
人工智能·python
tudficdew2 小时前
实战:用Python分析某电商销售数据
jvm·数据库·python
陈天伟教授2 小时前
人工智能应用-机器听觉:15. 声纹识别的应用
人工智能·神经网络·机器学习·语音识别