Ai大模型训练从零到1第一节(共81节)

本系列教程主要针对的是对大模型知其然而不知其所以然的人群,尤其是Ai的深度用户更需要阅读,因为本系列不仅关注 LLMs 的基础构建,包括 Transformer 架构、序列建模 等,还深度剖析GPT、BERT 等深度学习模型的底层实现。并在代码实现和学习资源上给出实例,帮助学习者从零开始构建 LLMs,全面掌握其核心技术。

提到大语言模型(LLMs),我们可能会将其视为独立于传统机器学习的领域,但实际上,LLMs 是机器学习的一个重要分支。在深度学习尚未广泛应用之前,机器学习在许多领域(如语音识别、自然语言处理、计算机视觉等)的作用相对有限,因为这些领域往往需要大量的专业知识来应对复杂的现实问题。然而,近几年深度学习的快速发展彻底改变了这一状况,使 LLMs 成为推动人工智能技术革命的关键力量。

一、安装Python

我的是Mac直接执行以下命令:

复制代码
curl -L -O "https://github.com/conda-forge/miniforge/releases/latest/download/Miniforge3-$(uname)-$(uname -m).sh"

Windows系统执行如下命令:

复制代码
start /wait "" Miniforge3-Windows-x86_64.exe /InstallationType=JustMe /RegisterPython=0 /S /D=%UserProfile%\Miniforge3

根据操作系统的不同,这会下载一个 .sh 文件(适用于 macOS 和 Linux)或 .exe 文件(适用于 Windows)。

对于 .sh 文件,打开命令行终端并执行以下命令:

复制代码
sh ~/Desktop/Miniforge3-MacOSX-arm64.sh

备注:Desktop/ 是下载 Miniforge 安装程序的文件夹。在你的计算机上,需要将其替换为 自己的路径

二、 创建新的虚拟环境

安装成功后,我建议创建一个名为 LLMs 的新虚拟环境,你可以通过执行以下命令完成:

复制代码
conda create -n LLMs python=3.10

许多科学计算库并不立即支持最新版本的 Python。因此,在安装 PyTorch 时,建议使用比最新版本低一到两个版本的 Python。例如,如果最新版本是 Python 3.13,推荐使用 Python 3.10 或 3.11。

😊别担心总会出问题的!!

提示找不到: command not found: conda

解决办法:

命令行也有提示执行

复制代码
eval "$(/Users/caixin/miniforge3/bin/conda shell.YOUR_SHELL_NAME hook)"

记得将 YOUR_SHELL_NAME 替换为自己系统支持的命令,通过命令行:

复制代码
echo $SHELL 

查询支持的命令,然后修改像我这样

最终执行命令

复制代码
eval "$(/Users/caixin/miniforge3/bin/conda shell.zsh hook)"            

这样环境就安装成功,接下来,激活你新创建的虚拟环境(每次打开新的终端窗口或标签页时都需要激活):

复制代码
conda activate LLMs

到这里,所有的准备工作已完成,你就可以继续学习和开发 😄

参考文档

1.GitHub - rasbt/LLMs-from-scratch: Implement a ChatGPT-like LLM in PyTorch from scratch, step by step

  1. https://github.com/conda-forge/miniforge
相关推荐
白-胖-子15 分钟前
深入剖析大模型在文本生成式 AI 产品架构中的核心地位
人工智能·架构
想要成为计算机高手1 小时前
11. isaacsim4.2教程-Transform 树与Odometry
人工智能·机器人·自动驾驶·ros·rviz·isaac sim·仿真环境
静心问道2 小时前
InstructBLIP:通过指令微调迈向通用视觉-语言模型
人工智能·多模态·ai技术应用
宇称不守恒4.03 小时前
2025暑期—06神经网络-常见网络2
网络·人工智能·神经网络
小楓12013 小时前
醫護行業在未來會被AI淘汰嗎?
人工智能·醫療·護理·職業
数据与人工智能律师3 小时前
数字迷雾中的安全锚点:解码匿名化与假名化的法律边界与商业价值
大数据·网络·人工智能·云计算·区块链
chenchihwen3 小时前
大模型应用班-第2课 DeepSeek使用与提示词工程课程重点 学习ollama 安装 用deepseek-r1:1.5b 分析PDF 内容
人工智能·学习
说私域3 小时前
公域流量向私域流量转化策略研究——基于开源AI智能客服、AI智能名片与S2B2C商城小程序的融合应用
人工智能·小程序
Java樱木4 小时前
AI 编程工具 Trae 重要的升级。。。
人工智能
凪卄12134 小时前
图像预处理 二
人工智能·python·深度学习·计算机视觉·pycharm