Build a Large Language Model (From Scratch)学习汇总

目录

中文理解代码

https://github.com/Czi24/Awesome-MLLM-LLM-Colab/tree/master/LLMs-from-scratch-CN-Colab

电子书

通过网盘分享的文件:Build a Large Language Model (From Scratch).pdf

链接: https://pan.baidu.com/s/1BKVbCtaW7BV2my-9_T9xSA?pwd=8vjk 提取码: 8vjk

--来自百度网盘超级会员v7的分享

全文中文翻译

第1章:理解大型语言模型

md版本:
https://blog.csdn.net/weixin_46460463/article/details/137842001

pdf版本:
https://blog.csdn.net/weixin_46460463/article/details/140028245

第2章:处理文本数据

md版本:
https://blog.csdn.net/weixin_46460463/article/details/138326265

pdf版本:
https://blog.csdn.net/weixin_46460463/article/details/140028914

第3章:编码Attention机制

md版本:
https://blog.csdn.net/weixin_46460463/article/details/137842001

pdf版本:
https://blog.csdn.net/weixin_46460463/article/details/140028527

第4章:从零实现GPT模型

md版本:
https://blog.csdn.net/weixin_46460463/article/details/140594223

pdf版本:

第5章:在未标记数据上进行预训练

md版本:
https://blog.csdn.net/weixin_46460463/article/details/140622833

pdf版本:
https://blog.csdn.net/weixin_46460463/article/details/140028821

第6章:用于文本分类的微调

pdf版本:
https://blog.csdn.net/weixin_46460463/article/details/140028973

第7章:为指令执行进行微调

pdf版本:
https://blog.csdn.net/weixin_46460463/article/details/140480811

附录A:PyTorch简介

pdf版本:
https://blog.csdn.net/weixin_46460463/article/details/140182619

附录E:使用LoRA进行参数高效微调

pdf版本:
https://blog.csdn.net/weixin_46460463/article/details/140181974

相关推荐
我命由我1234519 小时前
CSS 锚点定位 - 锚点定位引入(anchor-name、position-anchor)
开发语言·前端·javascript·css·学习·html·学习方法
啊阿狸不会拉杆19 小时前
《数字图像处理》第 11 章 - 特征提取
图像处理·人工智能·算法·计算机视觉·数字图像处理
ekprada19 小时前
Day 47 - 注意力热力图 (Attention Heatmap)
人工智能·机器学习
Yeats_Liao19 小时前
MindSpore开发之路(八):数据处理之Dataset(上)——构建高效的数据流水线
数据结构·人工智能·python·机器学习·华为
科士威传动20 小时前
精密仪器中的微型导轨如何选对润滑脂?
大数据·运维·人工智能·科技·机器人·自动化
yi个名字20 小时前
AIGC 调优实战:从模型部署到 API 应用的全链路优化策略
人工智能·aigc
dixiuapp20 小时前
智能报修系统从连接到预测的价值跃迁
大数据·人工智能·物联网·sass·工单管理系统
yy我不解释20 小时前
关于comfyui的token顺序打乱(二)
人工智能·python·flask
Blossom.11820 小时前
AI边缘计算实战:基于MNN框架的手机端文生图引擎实现
人工智能·深度学习·yolo·目标检测·智能手机·边缘计算·mnn
九河云20 小时前
人工智能驱动企业数字化转型:从效率工具到战略引擎
人工智能·物联网·算法·机器学习·数字化转型