《从零构建大语言模型》学习笔记1,环境配置

《从零构建大语言模型》学习笔记1,环境配置

文章目录


前言

暑假期间有点时间,趁这段时间把《从零构建大语言模型》这本书书学习一下,一直都对现在比较火的大预言模型有着非常大的好奇心,想要了解他背后的原理。本人的情况是有一些传统机器学习的基础在的,尤其是图像方面的一些卷积神经网络,但是现在各种人工智能的底层技术趋势是使用注意力模型,对这方面的知识我也只是了解理论上的实现,还没有自己从底层写代码去实现一些attention或者transformer的模型。正好在学习这本书的过程中一起实践一下。接下来就开始我的学习了,有一起学习的可以一起交流下经验,因为这个过程中肯定会碰到非常多问题。

这本书的原项目地址是:https://github.com/rasbt/LLMs-from-scratch,大家可以参考一起学习。接下来就进行第一部分,关于项目环境的配置。其实原作者在开始前还简单介绍了一下大型语言模型(LLMs)背后的基本概念和高层次的解释,这里我就不阐述了。直接就是开干,动手实践起来。

一、配置代码环境

学过python的都知道,我们每个项目最好都有个独立的python虚拟环境,这次才不会冲突。原作者是用UV来管理虚拟环境,这个我不熟悉,我还是继续使用conda来管理环境,当然大家也可以使用自己熟悉的python环境管理工具。

1.新建conda环境

bash 复制代码
conda create -n llms python==3.10

这里需要注意的是python版本最好是3.10以上

等待安装后,然后是激活环境

bash 复制代码
conda activate llms

2.安装新的 Python 库

在llms环境下我们准备安装必要的第三方库,原作者已经写好放在项目根目录的requirements.txt文件里。

我们只需要使用语句

bash 复制代码
pip install -r requirements.txt

这里需要注意的是记得执行语句前要记得切换到项目目录下。

还有因为每个人的电脑环境不一样,默认大家装的pytorch和tensorflow装的都是CPU版本的。如果大家有GPU,大家可以根据自己电脑的情况去官网更新一下这两个库,比如pytorch的官网:<pytorch.org>

因为我电脑用的是cuda12.6,所以我得安装语句是

bash 复制代码
pip3 install torch torchvision --index-url https://download.pytorch.org/whl/cu126

3.验证环境

安装后可以在当前环境下执行step\02_installing-python-libraries\python_environment_check.py脚本。

如果有以上库则没什么问题。

相关推荐
阿杰学AI2 分钟前
AI核心知识24——大语言模型之AI 幻觉(简洁且通俗易懂版)
人工智能·ai·语言模型·aigc·hallucination·ai幻觉
AI_56783 分钟前
AI知识库如何重塑服务体验
大数据·人工智能
公众号-架构师汤师爷7 分钟前
n8n工作流实战:让DeepSeek一键拆解100篇公众号爆文,扒得底裤都不剩(建议收藏)
人工智能·智能体·n8n
一只乔哇噻12 分钟前
java后端工程师+AI大模型进修ing(研一版‖day57)
java·开发语言·人工智能·算法·语言模型
张较瘦_13 分钟前
[论文阅读] AI + 编码 | Agint:让LLM编码代理告别“混乱”,用图编译打通自然语言到可执行代码的任督二脉
论文阅读·人工智能
修一呀22 分钟前
【声音分离】多人语音分离方案:ClearVoice + MossFormer2_SS_16K 实战教程
人工智能·语音识别
_codemonster32 分钟前
深度学习实战(基于pytroch)系列(三十六)循环神经网络的pytorch简洁实现
pytorch·rnn·深度学习
自然语32 分钟前
人工智能之数字生命-学习的过程
数据结构·人工智能·深度学习·学习·算法
你好~每一天40 分钟前
从传统行业到AI入门:我的CAIE Level I学习体验与思考
大数据·数据结构·人工智能·学习·jupyter·idea
core51240 分钟前
【Java AI 新纪元】Spring AI 深度解析:让 Java 开发者无缝接入大模型
java·人工智能·spring·ai