Ai大模型训练从零到1第一节(共81节)

本系列教程主要针对的是对大模型知其然而不知其所以然的人群,尤其是Ai的深度用户更需要阅读,因为本系列不仅关注 LLMs 的基础构建,包括 Transformer 架构、序列建模 等,还深度剖析GPT、BERT 等深度学习模型的底层实现。并在代码实现和学习资源上给出实例,帮助学习者从零开始构建 LLMs,全面掌握其核心技术。

提到大语言模型(LLMs),我们可能会将其视为独立于传统机器学习的领域,但实际上,LLMs 是机器学习的一个重要分支。在深度学习尚未广泛应用之前,机器学习在许多领域(如语音识别、自然语言处理、计算机视觉等)的作用相对有限,因为这些领域往往需要大量的专业知识来应对复杂的现实问题。然而,近几年深度学习的快速发展彻底改变了这一状况,使 LLMs 成为推动人工智能技术革命的关键力量。

一、安装Python

我的是Mac直接执行以下命令:

复制代码
curl -L -O "https://github.com/conda-forge/miniforge/releases/latest/download/Miniforge3-$(uname)-$(uname -m).sh"

Windows系统执行如下命令:

复制代码
start /wait "" Miniforge3-Windows-x86_64.exe /InstallationType=JustMe /RegisterPython=0 /S /D=%UserProfile%\Miniforge3

根据操作系统的不同,这会下载一个 .sh 文件(适用于 macOS 和 Linux)或 .exe 文件(适用于 Windows)。

对于 .sh 文件,打开命令行终端并执行以下命令:

复制代码
sh ~/Desktop/Miniforge3-MacOSX-arm64.sh

备注:Desktop/ 是下载 Miniforge 安装程序的文件夹。在你的计算机上,需要将其替换为 自己的路径

二、 创建新的虚拟环境

安装成功后,我建议创建一个名为 LLMs 的新虚拟环境,你可以通过执行以下命令完成:

复制代码
conda create -n LLMs python=3.10

许多科学计算库并不立即支持最新版本的 Python。因此,在安装 PyTorch 时,建议使用比最新版本低一到两个版本的 Python。例如,如果最新版本是 Python 3.13,推荐使用 Python 3.10 或 3.11。

😊别担心总会出问题的!!

提示找不到: command not found: conda

解决办法:

命令行也有提示执行

复制代码
eval "$(/Users/caixin/miniforge3/bin/conda shell.YOUR_SHELL_NAME hook)"

记得将 YOUR_SHELL_NAME 替换为自己系统支持的命令,通过命令行:

复制代码
echo $SHELL 

查询支持的命令,然后修改像我这样

最终执行命令

复制代码
eval "$(/Users/caixin/miniforge3/bin/conda shell.zsh hook)"            

这样环境就安装成功,接下来,激活你新创建的虚拟环境(每次打开新的终端窗口或标签页时都需要激活):

复制代码
conda activate LLMs

到这里,所有的准备工作已完成,你就可以继续学习和开发 😄

参考文档

1.GitHub - rasbt/LLMs-from-scratch: Implement a ChatGPT-like LLM in PyTorch from scratch, step by step

  1. https://github.com/conda-forge/miniforge
相关推荐
汽车仪器仪表相关领域3 分钟前
AI赋能智能检测,引领灯光检测新高度——NHD-6109智能全自动远近光检测仪项目实战分享
大数据·人工智能·功能测试·机器学习·汽车·可用性测试·安全性测试
brave and determined6 分钟前
工程设计类学习(DAY4):硬件可靠性测试全攻略:标准到实战
人工智能·嵌入式硬件·测试·硬件设计·可靠性测试·嵌入式设计·可靠性方法
Stuomasi_xiaoxin7 分钟前
ROS2介绍,及ubuntu22.04 安装ROS 2部署使用!
linux·人工智能·深度学习·ubuntu
lovingsoft8 分钟前
AI+敏捷时代,专项测试人员是否还有存在的必要?
人工智能
木头程序员14 分钟前
大模型边缘部署突破:动态推理技术与精度-延迟-能耗帕累托优化
大数据·人工智能·计算机视觉·自然语言处理·智能手机·数据挖掘
DX_水位流量监测17 分钟前
无人机测流之雷达流速仪监测技术分析
大数据·网络·人工智能·数据分析·自动化·无人机
昨日之日200617 分钟前
LTX-2 - 一键生成音视频,创作更轻松 支持50系显卡 ComfyUI工作流 一键整合包
人工智能·音视频·视频
imbackneverdie21 分钟前
Science最新文章:大型语言模型时代的科学生产
人工智能·语言模型·自然语言处理·aigc·ai写作
P-ShineBeam24 分钟前
八卡A100服务器坏卡引发 CUDA initialization: cudaGetDeviceCount()异常
运维·服务器·人工智能·语言模型
真上帝的左手26 分钟前
26. AI-框架工具-LangChain & LangGraph
人工智能·langchain