Ai大模型训练从零到1第一节(共81节)

本系列教程主要针对的是对大模型知其然而不知其所以然的人群,尤其是Ai的深度用户更需要阅读,因为本系列不仅关注 LLMs 的基础构建,包括 Transformer 架构、序列建模 等,还深度剖析GPT、BERT 等深度学习模型的底层实现。并在代码实现和学习资源上给出实例,帮助学习者从零开始构建 LLMs,全面掌握其核心技术。

提到大语言模型(LLMs),我们可能会将其视为独立于传统机器学习的领域,但实际上,LLMs 是机器学习的一个重要分支。在深度学习尚未广泛应用之前,机器学习在许多领域(如语音识别、自然语言处理、计算机视觉等)的作用相对有限,因为这些领域往往需要大量的专业知识来应对复杂的现实问题。然而,近几年深度学习的快速发展彻底改变了这一状况,使 LLMs 成为推动人工智能技术革命的关键力量。

一、安装Python

我的是Mac直接执行以下命令:

复制代码
curl -L -O "https://github.com/conda-forge/miniforge/releases/latest/download/Miniforge3-$(uname)-$(uname -m).sh"

Windows系统执行如下命令:

复制代码
start /wait "" Miniforge3-Windows-x86_64.exe /InstallationType=JustMe /RegisterPython=0 /S /D=%UserProfile%\Miniforge3

根据操作系统的不同,这会下载一个 .sh 文件(适用于 macOS 和 Linux)或 .exe 文件(适用于 Windows)。

对于 .sh 文件,打开命令行终端并执行以下命令:

复制代码
sh ~/Desktop/Miniforge3-MacOSX-arm64.sh

备注:Desktop/ 是下载 Miniforge 安装程序的文件夹。在你的计算机上,需要将其替换为 自己的路径

二、 创建新的虚拟环境

安装成功后,我建议创建一个名为 LLMs 的新虚拟环境,你可以通过执行以下命令完成:

复制代码
conda create -n LLMs python=3.10

许多科学计算库并不立即支持最新版本的 Python。因此,在安装 PyTorch 时,建议使用比最新版本低一到两个版本的 Python。例如,如果最新版本是 Python 3.13,推荐使用 Python 3.10 或 3.11。

😊别担心总会出问题的!!

提示找不到: command not found: conda

解决办法:

命令行也有提示执行

复制代码
eval "$(/Users/caixin/miniforge3/bin/conda shell.YOUR_SHELL_NAME hook)"

记得将 YOUR_SHELL_NAME 替换为自己系统支持的命令,通过命令行:

复制代码
echo $SHELL 

查询支持的命令,然后修改像我这样

最终执行命令

复制代码
eval "$(/Users/caixin/miniforge3/bin/conda shell.zsh hook)"            

这样环境就安装成功,接下来,激活你新创建的虚拟环境(每次打开新的终端窗口或标签页时都需要激活):

复制代码
conda activate LLMs

到这里,所有的准备工作已完成,你就可以继续学习和开发 😄

参考文档

1.GitHub - rasbt/LLMs-from-scratch: Implement a ChatGPT-like LLM in PyTorch from scratch, step by step

  1. https://github.com/conda-forge/miniforge
相关推荐
LaughingZhu4 分钟前
Product Hunt 每日热榜 | 2026-03-21
人工智能·经验分享·深度学习·神经网络·产品运营
qzhqbb5 分钟前
差分隐私与大模型+差分隐私在相关领域应用的论文总结
人工智能·算法
一招定胜负8 分钟前
基于通义千问 API 的课堂话语智能分类分析工具实现
人工智能·分类·数据挖掘
阿_旭14 分钟前
基于YOLO26深度学习的【桃子成熟度检测与分割系统】【python源码+Pyqt5界面+数据集+训练代码】图像分割、人工智能
人工智能·python·深度学习·桃子成熟度检测
CoderJia程序员甲17 分钟前
GitHub 热榜项目 - 日榜(2026-03-22)
人工智能·ai·大模型·github·ai教程
剑穗挂着新流苏31219 分钟前
109_神经网络的决策层:线性层(Linear Layer)与数据展平详解
人工智能·pytorch·深度学习
机器白学20 分钟前
OpenClaw本地Docker安装部署+自定义配置国内大模型
人工智能
逄逄不是胖胖20 分钟前
《动手学深度学习》-69BERT预训练实现
人工智能·深度学习
LSssT.21 分钟前
【02】线性回归:机器学习的入门第一课
人工智能·机器学习·线性回归
多年小白23 分钟前
今日AI科技简报(2026年3月18日)
人工智能·科技