nanoGPT 部署

NanoGPT 是由 Andrej Karpathy(前特斯拉 AI 总监)开源的一个 极简版 GPT(Generative Pre-trained Transformer)实现

它的目标不是直接用于大规模商业应用,而是 教育、研究和实验,帮助人们理解 GPT 模型的核心原理。

特点:

  • 代码简洁、结构清晰,便于阅读。

  • 模型规模小,适合在个人电脑上训练和测试。

  • 使用 PyTorch 实现,方便修改和扩展。

Github 地址:https://github.com/karpathy/nanoGPT#


  1. 使用 Anaconda 创建 python 虚拟环境

    conda create --prefix D:\conda_envs\nanoGPT python=3.9

--prefix:指定虚拟环境安装的位置

我的电脑是 RTX5060 CUDA12.8,下载如下版本的 pytorch

复制代码
pip3 install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/cu128
或 Anaconda Prompt 中运行:python -m pip install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/cu128

安装代码的相关依赖

复制代码
pip install  tiktoken 
  1. 拉取代码

    git clone https://github.com/karpathy/nanoGPT.git

  2. 运行

    python data/shakespeare_char/prepare.py

在 config/train_shakespeare_char.py 文件中加上 compile = False,再运行

复制代码
python train.py config/train_shakespeare_char.py

python sample.py --out_dir=out-shakespeare-char
复制代码
相关推荐
SunnyDays10111 分钟前
如何使用 Python 将 PDF 转换为 TIFF 或将 TIFF 转换为 PDF
人工智能·python·pdf
2zcode4 分钟前
基于深度学习的违章停车检测系统的设计与实现
人工智能·深度学习
tianyuanwo4 分钟前
CentOS 7 使用 CentOS 8 YUM 源报错 “Invalid version flag: if” 深度解析
python·centos·yum
技术钱6 分钟前
Flask-SQLAIchemy和Flask-Migrate扩展的配置与使用
数据库·python·flask
Li emily6 分钟前
用Python批量调用外汇接口获取多货币汇率
人工智能·python·api·fastapi
财经资讯数据_灵砚智能10 分钟前
基于全球经济类多源新闻的NLP情感分析与数据可视化(日间)2026年4月30日
人工智能·python·信息可视化·自然语言处理·ai编程
xzal1211 分钟前
pygame之键盘控制方块移动方法
python·pygame
天才少女爱迪生25 分钟前
word格式规范检测+自动修改【python】
python·c#·word
南宫萧幕28 分钟前
基于 PSO 的 HEV 能量管理策略:从联合仿真建模到排错实战
开发语言·python·算法·matlab·控制
在下_诸葛28 分钟前
langgraph学习笔记
笔记·python·学习·langgraph教程