Ai大模型训练从零到1第一节(共81节)

本系列教程主要针对的是对大模型知其然而不知其所以然的人群,尤其是Ai的深度用户更需要阅读,因为本系列不仅关注 LLMs 的基础构建,包括 Transformer 架构、序列建模 等,还深度剖析GPT、BERT 等深度学习模型的底层实现。并在代码实现和学习资源上给出实例,帮助学习者从零开始构建 LLMs,全面掌握其核心技术。

提到大语言模型(LLMs),我们可能会将其视为独立于传统机器学习的领域,但实际上,LLMs 是机器学习的一个重要分支。在深度学习尚未广泛应用之前,机器学习在许多领域(如语音识别、自然语言处理、计算机视觉等)的作用相对有限,因为这些领域往往需要大量的专业知识来应对复杂的现实问题。然而,近几年深度学习的快速发展彻底改变了这一状况,使 LLMs 成为推动人工智能技术革命的关键力量。

一、安装Python

我的是Mac直接执行以下命令:

复制代码
curl -L -O "https://github.com/conda-forge/miniforge/releases/latest/download/Miniforge3-$(uname)-$(uname -m).sh"

Windows系统执行如下命令:

复制代码
start /wait "" Miniforge3-Windows-x86_64.exe /InstallationType=JustMe /RegisterPython=0 /S /D=%UserProfile%\Miniforge3

根据操作系统的不同,这会下载一个 .sh 文件(适用于 macOS 和 Linux)或 .exe 文件(适用于 Windows)。

对于 .sh 文件,打开命令行终端并执行以下命令:

复制代码
sh ~/Desktop/Miniforge3-MacOSX-arm64.sh

备注:Desktop/ 是下载 Miniforge 安装程序的文件夹。在你的计算机上,需要将其替换为 自己的路径

二、 创建新的虚拟环境

安装成功后,我建议创建一个名为 LLMs 的新虚拟环境,你可以通过执行以下命令完成:

复制代码
conda create -n LLMs python=3.10

许多科学计算库并不立即支持最新版本的 Python。因此,在安装 PyTorch 时,建议使用比最新版本低一到两个版本的 Python。例如,如果最新版本是 Python 3.13,推荐使用 Python 3.10 或 3.11。

😊别担心总会出问题的!!

提示找不到: command not found: conda

解决办法:

命令行也有提示执行

复制代码
eval "$(/Users/caixin/miniforge3/bin/conda shell.YOUR_SHELL_NAME hook)"

记得将 YOUR_SHELL_NAME 替换为自己系统支持的命令,通过命令行:

复制代码
echo $SHELL 

查询支持的命令,然后修改像我这样

最终执行命令

复制代码
eval "$(/Users/caixin/miniforge3/bin/conda shell.zsh hook)"            

这样环境就安装成功,接下来,激活你新创建的虚拟环境(每次打开新的终端窗口或标签页时都需要激活):

复制代码
conda activate LLMs

到这里,所有的准备工作已完成,你就可以继续学习和开发 😄

参考文档

1.GitHub - rasbt/LLMs-from-scratch: Implement a ChatGPT-like LLM in PyTorch from scratch, step by step

  1. https://github.com/conda-forge/miniforge
相关推荐
dajun18112345620 分钟前
反 AI 生成技术兴起:如何识别与过滤海量的 AI 伪造内容?
人工智能
人邮异步社区42 分钟前
PRML为何是机器学习的经典书籍中的经典?
人工智能·机器学习
paceboy1 小时前
Claude和Cursor之间的切换
人工智能·程序人生
GISer_Jing1 小时前
AI营销增长:4大核心能力+前端落地指南
前端·javascript·人工智能
驴友花雕1 小时前
【花雕动手做】CanMV K230 AI视觉识别模块之使用CanMV IDE调试运行人脸代码
ide·人工智能·单片机·嵌入式硬件·canmv k230 ai视觉·canmv ide 人脸代码
猫头虎1 小时前
又又又双叒叕一款AI IDE发布,国内第五款国产AI IDE Qoder来了
ide·人工智能·langchain·prompt·aigc·intellij-idea·ai编程
weixin_387545641 小时前
Antigravity 上手指南:打造 VS Code 风格的 AI IDE
ide·人工智能
程序届的伪精英1 小时前
IDE TRAE介绍与使用
ide·人工智能
资深程序员 哈克(21年开发经验)1 小时前
2025 年 AI编程软件 IDE 的深入对比与推荐排行:从好用到生成效果的转变
人工智能·ai编程
奇树谦1 小时前
2025 嵌入式 AI IDE 全面对比:Trae、Copilot、Windsurf、Cursor 谁最值得个人开发者入手?
ide·人工智能·copilot