Build a Large Language Model (From Scratch)学习汇总

目录

中文理解代码

https://github.com/Czi24/Awesome-MLLM-LLM-Colab/tree/master/LLMs-from-scratch-CN-Colab

电子书

通过网盘分享的文件:Build a Large Language Model (From Scratch).pdf

链接: https://pan.baidu.com/s/1BKVbCtaW7BV2my-9_T9xSA?pwd=8vjk 提取码: 8vjk

--来自百度网盘超级会员v7的分享

全文中文翻译

第1章:理解大型语言模型

md版本:
https://blog.csdn.net/weixin_46460463/article/details/137842001

pdf版本:
https://blog.csdn.net/weixin_46460463/article/details/140028245

第2章:处理文本数据

md版本:
https://blog.csdn.net/weixin_46460463/article/details/138326265

pdf版本:
https://blog.csdn.net/weixin_46460463/article/details/140028914

第3章:编码Attention机制

md版本:
https://blog.csdn.net/weixin_46460463/article/details/137842001

pdf版本:
https://blog.csdn.net/weixin_46460463/article/details/140028527

第4章:从零实现GPT模型

md版本:
https://blog.csdn.net/weixin_46460463/article/details/140594223

pdf版本:

第5章:在未标记数据上进行预训练

md版本:
https://blog.csdn.net/weixin_46460463/article/details/140622833

pdf版本:
https://blog.csdn.net/weixin_46460463/article/details/140028821

第6章:用于文本分类的微调

pdf版本:
https://blog.csdn.net/weixin_46460463/article/details/140028973

第7章:为指令执行进行微调

pdf版本:
https://blog.csdn.net/weixin_46460463/article/details/140480811

附录A:PyTorch简介

pdf版本:
https://blog.csdn.net/weixin_46460463/article/details/140182619

附录E:使用LoRA进行参数高效微调

pdf版本:
https://blog.csdn.net/weixin_46460463/article/details/140181974

相关推荐
qq_262498115 分钟前
Datawhale AI夏令营---coze空间共学
人工智能
失散1312 分钟前
自然语言处理——04 注意力机制
人工智能·自然语言处理·注意力机制·seq2seq 架构
shuououo32 分钟前
集成算法学习笔记
笔记·学习·算法
学历真的很重要38 分钟前
Eino 开源框架全景解析 - 以“大模型应用的搭积木指南”方式理解(一)
后端·语言模型·面试·golang·ai编程·eino
MiaoChuAI1 小时前
豆包AI PPT与秒出PPT对比评测:谁更适合你?
人工智能·powerpoint
%KT%1 小时前
简单聊聊多模态大语言模型MLLM
人工智能·语言模型·自然语言处理
唐某人丶1 小时前
教你如何用 JS 实现一个 Agent 系统(1)—— 认识 Agentic System
前端·人工智能
泡泡茶壶_ovo1 小时前
RORPCAP: retrieval-based objects and relations prompt for image captioning
人工智能·深度学习·计算机视觉·语言模型·prompt·多模态·imagecaptioning
MaxCode-11 小时前
单智能体篇:Prompt工程艺术
大数据·人工智能·prompt
小鹿的工作手帐2 小时前
有鹿机器人:智慧清洁新时代的引领者
人工智能·科技·机器人