nanoGPT 部署

NanoGPT 是由 Andrej Karpathy(前特斯拉 AI 总监)开源的一个 极简版 GPT(Generative Pre-trained Transformer)实现

它的目标不是直接用于大规模商业应用,而是 教育、研究和实验,帮助人们理解 GPT 模型的核心原理。

特点:

  • 代码简洁、结构清晰,便于阅读。

  • 模型规模小,适合在个人电脑上训练和测试。

  • 使用 PyTorch 实现,方便修改和扩展。

Github 地址:https://github.com/karpathy/nanoGPT#


  1. 使用 Anaconda 创建 python 虚拟环境

    conda create --prefix D:\conda_envs\nanoGPT python=3.9

--prefix:指定虚拟环境安装的位置

我的电脑是 RTX5060 CUDA12.8,下载如下版本的 pytorch

复制代码
pip3 install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/cu128
或 Anaconda Prompt 中运行:python -m pip install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/cu128

安装代码的相关依赖

复制代码
pip install  tiktoken 
  1. 拉取代码

    git clone https://github.com/karpathy/nanoGPT.git

  2. 运行

    python data/shakespeare_char/prepare.py

在 config/train_shakespeare_char.py 文件中加上 compile = False,再运行

复制代码
python train.py config/train_shakespeare_char.py

python sample.py --out_dir=out-shakespeare-char
复制代码
相关推荐
eqwaak01 分钟前
实战项目与工程化:端到端机器学习流程全解析
开发语言·人工智能·python·机器学习·语言模型
防搞活机19 分钟前
ubuntu 服务器(带NVLink)更新显卡驱动 (巨坑!!)
linux·服务器·深度学习·ubuntu·gpu算力·显卡驱动
audyxiao00121 分钟前
NeurIPS 2025论文分享|FedFree:突破知识共享壁垒的异构联邦学习新框架
大数据·人工智能·机器学习·大模型·智能体
upgrador1 小时前
PYTHON:Python 新版本下载安装更新&py文件Pycharm运行指南
开发语言·python
闲人编程1 小时前
使用Django从零开始构建一个个人博客系统
后端·python·django·接口·restful·web·个人博客
做运维的阿瑞1 小时前
从入门到精通:Django的深度探索之旅
开发语言·后端·python·系统架构·django
czliutz1 小时前
Phpstudy博客网站apache2日志分析python代码
开发语言·python
AI数据皮皮侠2 小时前
全国各省市绿色金融指数及原始数据(1990-2022年)
大数据·人工智能·python·深度学习·机器学习·金融
zzywxc7872 小时前
AI行业应用全景:从金融风控到智能制造的落地实践与技术解析
人工智能·深度学习·spring·机器学习·prompt·制造
丁学文武2 小时前
大模型原理与实践:第二章-Transformer架构_第2部分Encoder-Decoder架构
人工智能·深度学习·transformer