Ai大模型训练从零到1第一节(共81节)

本系列教程主要针对的是对大模型知其然而不知其所以然的人群,尤其是Ai的深度用户更需要阅读,因为本系列不仅关注 LLMs 的基础构建,包括 Transformer 架构、序列建模 等,还深度剖析GPT、BERT 等深度学习模型的底层实现。并在代码实现和学习资源上给出实例,帮助学习者从零开始构建 LLMs,全面掌握其核心技术。

提到大语言模型(LLMs),我们可能会将其视为独立于传统机器学习的领域,但实际上,LLMs 是机器学习的一个重要分支。在深度学习尚未广泛应用之前,机器学习在许多领域(如语音识别、自然语言处理、计算机视觉等)的作用相对有限,因为这些领域往往需要大量的专业知识来应对复杂的现实问题。然而,近几年深度学习的快速发展彻底改变了这一状况,使 LLMs 成为推动人工智能技术革命的关键力量。

一、安装Python

我的是Mac直接执行以下命令:

复制代码
curl -L -O "https://github.com/conda-forge/miniforge/releases/latest/download/Miniforge3-$(uname)-$(uname -m).sh"

Windows系统执行如下命令:

复制代码
start /wait "" Miniforge3-Windows-x86_64.exe /InstallationType=JustMe /RegisterPython=0 /S /D=%UserProfile%\Miniforge3

根据操作系统的不同,这会下载一个 .sh 文件(适用于 macOS 和 Linux)或 .exe 文件(适用于 Windows)。

对于 .sh 文件,打开命令行终端并执行以下命令:

复制代码
sh ~/Desktop/Miniforge3-MacOSX-arm64.sh

备注:Desktop/ 是下载 Miniforge 安装程序的文件夹。在你的计算机上,需要将其替换为 自己的路径

二、 创建新的虚拟环境

安装成功后,我建议创建一个名为 LLMs 的新虚拟环境,你可以通过执行以下命令完成:

复制代码
conda create -n LLMs python=3.10

许多科学计算库并不立即支持最新版本的 Python。因此,在安装 PyTorch 时,建议使用比最新版本低一到两个版本的 Python。例如,如果最新版本是 Python 3.13,推荐使用 Python 3.10 或 3.11。

😊别担心总会出问题的!!

提示找不到: command not found: conda

解决办法:

命令行也有提示执行

复制代码
eval "$(/Users/caixin/miniforge3/bin/conda shell.YOUR_SHELL_NAME hook)"

记得将 YOUR_SHELL_NAME 替换为自己系统支持的命令,通过命令行:

复制代码
echo $SHELL 

查询支持的命令,然后修改像我这样

最终执行命令

复制代码
eval "$(/Users/caixin/miniforge3/bin/conda shell.zsh hook)"            

这样环境就安装成功,接下来,激活你新创建的虚拟环境(每次打开新的终端窗口或标签页时都需要激活):

复制代码
conda activate LLMs

到这里,所有的准备工作已完成,你就可以继续学习和开发 😄

参考文档

1.GitHub - rasbt/LLMs-from-scratch: Implement a ChatGPT-like LLM in PyTorch from scratch, step by step

  1. https://github.com/conda-forge/miniforge
相关推荐
渲吧云渲染3 小时前
SaaS模式重构工业软件竞争规则,助力中小企业快速实现数字化转型
大数据·人工智能·sass
算家云3 小时前
DeepSeek-OCR本地部署教程:DeepSeek突破性开创上下文光学压缩,10倍效率重构文本处理范式
人工智能·计算机视觉·算家云·模型部署教程·镜像社区·deepseek-ocr
AgeClub3 小时前
1.2亿老人需助听器:本土品牌如何以AI破局,重构巨头垄断市场?
人工智能
PPIO派欧云5 小时前
PPIO上线Qwen-VL-8B/30B、GLM-4.5-Air等多款中小尺寸模型
人工智能
chenchihwen6 小时前
AI代码开发宝库系列:FAISS向量数据库
数据库·人工智能·python·faiss·1024程序员节
张登杰踩6 小时前
工业产品表面缺陷检测方法综述:从传统视觉到深度学习
人工智能·深度学习
sponge'7 小时前
opencv学习笔记6:SVM分类器
人工智能·机器学习·支持向量机·1024程序员节
zandy10117 小时前
2025年AI IDE的深度评测与推荐:从单一功能效率转向生态壁垒
ide·人工智能
andyguo7 小时前
ChatGPT Atlas vs Chrome:AI 浏览器的新纪元
人工智能·chrome·chatgpt