nanoGPT 部署

NanoGPT 是由 Andrej Karpathy(前特斯拉 AI 总监)开源的一个 极简版 GPT(Generative Pre-trained Transformer)实现

它的目标不是直接用于大规模商业应用,而是 教育、研究和实验,帮助人们理解 GPT 模型的核心原理。

特点:

  • 代码简洁、结构清晰,便于阅读。

  • 模型规模小,适合在个人电脑上训练和测试。

  • 使用 PyTorch 实现,方便修改和扩展。

Github 地址:https://github.com/karpathy/nanoGPT#


  1. 使用 Anaconda 创建 python 虚拟环境

    conda create --prefix D:\conda_envs\nanoGPT python=3.9

--prefix:指定虚拟环境安装的位置

我的电脑是 RTX5060 CUDA12.8,下载如下版本的 pytorch

复制代码
pip3 install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/cu128
或 Anaconda Prompt 中运行:python -m pip install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/cu128

安装代码的相关依赖

复制代码
pip install  tiktoken 
  1. 拉取代码

    git clone https://github.com/karpathy/nanoGPT.git

  2. 运行

    python data/shakespeare_char/prepare.py

在 config/train_shakespeare_char.py 文件中加上 compile = False,再运行

复制代码
python train.py config/train_shakespeare_char.py

python sample.py --out_dir=out-shakespeare-char
复制代码
相关推荐
wokaoyan19814 分钟前
逻辑推演题——谁是骗子
python
九年义务漏网鲨鱼5 分钟前
利用AI大模型重构陈旧代码库 (Refactoring Legacy Codebase with AI)
python
滑水滑成滑头17 分钟前
**标题:发散创新:智能交通系统的深度探究与实现**摘要:本文将详细
java·人工智能·python
闭着眼睛学算法36 分钟前
【双机位A卷】华为OD笔试之【哈希表】双机位A-跳房子I【Py/Java/C++/C/JS/Go六种语言】【欧弟算法】全网注释最详细分类最全的华子OD真题题解
java·c语言·c++·python·算法·华为od·散列表
周杰伦_Jay41 分钟前
【PaddleOCR深度解析与DeepSeek-OCR对比】开源OCR工具库的技术路线与场景适配
人工智能·机器学习·云原生·架构·开源·ocr
无限码力41 分钟前
华为OD技术面真题 - Python开发 - 2
python·华为od·华为od技术面真题·华为od技术面八股·华为od技术面python八股·华为od面试python真题·华为odpython八股
曾经的三心草1 小时前
深度学习9-循环神经网络
人工智能·rnn·深度学习
Cathy Bryant1 小时前
线性代数直觉(二):二次型与“正定”
笔记·神经网络·考研·机器学习·数学建模
OG one.Z1 小时前
07_朴素贝叶斯
人工智能·机器学习
青云交2 小时前
Java 大视界 -- Java 大数据机器学习模型在智能客服多轮对话系统中的优化策略
深度学习·自然语言处理·智能客服·数据预处理·机器学习模型·java 大数据·多轮对话系统