nanoGPT 部署

NanoGPT 是由 Andrej Karpathy(前特斯拉 AI 总监)开源的一个 极简版 GPT(Generative Pre-trained Transformer)实现

它的目标不是直接用于大规模商业应用,而是 教育、研究和实验,帮助人们理解 GPT 模型的核心原理。

特点:

  • 代码简洁、结构清晰,便于阅读。

  • 模型规模小,适合在个人电脑上训练和测试。

  • 使用 PyTorch 实现,方便修改和扩展。

Github 地址:https://github.com/karpathy/nanoGPT#


  1. 使用 Anaconda 创建 python 虚拟环境

    conda create --prefix D:\conda_envs\nanoGPT python=3.9

--prefix:指定虚拟环境安装的位置

我的电脑是 RTX5060 CUDA12.8,下载如下版本的 pytorch

复制代码
pip3 install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/cu128
或 Anaconda Prompt 中运行:python -m pip install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/cu128

安装代码的相关依赖

复制代码
pip install  tiktoken 
  1. 拉取代码

    git clone https://github.com/karpathy/nanoGPT.git

  2. 运行

    python data/shakespeare_char/prepare.py

在 config/train_shakespeare_char.py 文件中加上 compile = False,再运行

复制代码
python train.py config/train_shakespeare_char.py

python sample.py --out_dir=out-shakespeare-char
复制代码
相关推荐
Eric.Lee202121 小时前
python实现 mp4转gif文件
开发语言·python·手势识别·手势交互·手势建模·xr混合现实
EntyIU21 小时前
python开发中虚拟环境配置
开发语言·python
wszy180921 小时前
顶部标题栏的设计与实现:让用户知道自己在哪
java·python·react native·harmonyos
kaizq21 小时前
AI-MCP-SQLite-SSE本地服务及CherryStudio便捷应用
python·sqlite·llm·sse·mcp·cherry studio·fastmcp
Hcoco_me21 小时前
RNN(循环神经网络)
人工智能·rnn·深度学习
!chen1 天前
Error: error:0308010C:digital envelope routines::unsupporte
python
武子康1 天前
大数据-209 深度理解逻辑回归(Logistic Regression)与梯度下降优化算法
大数据·后端·机器学习
小北方城市网1 天前
分布式锁实战指南:从选型到落地,避开 90% 的坑
java·数据库·redis·分布式·python·缓存
xiaolyuh1231 天前
【XXL-JOB】 GLUE模式 底层实现原理
java·开发语言·前端·python·xxl-job
likuolei1 天前
Spring AI框架完整指南
人工智能·python·spring