Build a Large Language Model (From Scratch)学习汇总

目录

中文理解代码

https://github.com/Czi24/Awesome-MLLM-LLM-Colab/tree/master/LLMs-from-scratch-CN-Colab

电子书

通过网盘分享的文件:Build a Large Language Model (From Scratch).pdf

链接: https://pan.baidu.com/s/1BKVbCtaW7BV2my-9_T9xSA?pwd=8vjk 提取码: 8vjk

--来自百度网盘超级会员v7的分享

全文中文翻译

第1章:理解大型语言模型

md版本:
https://blog.csdn.net/weixin_46460463/article/details/137842001

pdf版本:
https://blog.csdn.net/weixin_46460463/article/details/140028245

第2章:处理文本数据

md版本:
https://blog.csdn.net/weixin_46460463/article/details/138326265

pdf版本:
https://blog.csdn.net/weixin_46460463/article/details/140028914

第3章:编码Attention机制

md版本:
https://blog.csdn.net/weixin_46460463/article/details/137842001

pdf版本:
https://blog.csdn.net/weixin_46460463/article/details/140028527

第4章:从零实现GPT模型

md版本:
https://blog.csdn.net/weixin_46460463/article/details/140594223

pdf版本:

第5章:在未标记数据上进行预训练

md版本:
https://blog.csdn.net/weixin_46460463/article/details/140622833

pdf版本:
https://blog.csdn.net/weixin_46460463/article/details/140028821

第6章:用于文本分类的微调

pdf版本:
https://blog.csdn.net/weixin_46460463/article/details/140028973

第7章:为指令执行进行微调

pdf版本:
https://blog.csdn.net/weixin_46460463/article/details/140480811

附录A:PyTorch简介

pdf版本:
https://blog.csdn.net/weixin_46460463/article/details/140182619

附录E:使用LoRA进行参数高效微调

pdf版本:
https://blog.csdn.net/weixin_46460463/article/details/140181974

相关推荐
萤丰信息1 分钟前
数字经济与 “双碳” 战略双轮驱动下 智慧园区的智能化管理实践与未来演进
大数据·人工智能·科技·智慧城市·智慧园区
pingao1413782 分钟前
实时远程监控,4G温湿度传感器守护环境安全
大数据·人工智能·安全
shangjian00711 分钟前
AI大模型-深度学习-卷积神经网络CNN
人工智能·神经网络·cnn
塔楼17 分钟前
Deep Think with Confidence:让大模型更准确
语言模型·大模型推理
发哥来了17 分钟前
主流AI视频生成商用方案选型:关键维度与成本效益分析
大数据·人工智能
诗远Yolanda20 分钟前
EI国际会议-通信技术、电子学与信号处理(CTESP 2026)
图像处理·人工智能·算法·计算机视觉·机器人·信息与通信·信号处理
智定义科技23 分钟前
#智慧景区#景区票务综合管理平台:全渠道票务一体化管理新范式
人工智能·智慧文旅·智慧景区·票务系统·景区系统·景区票务系统开发·门票系统
yangguangwuyue32 分钟前
Windows 下 CMake + OpenCV 编译乱码问题的定位与解决(Msbuild 乱码问题)
人工智能·windows·opencv
2501_9413331036 分钟前
【深度学习强对流天气识别】:基于YOLO11-C3k2-SCcConv模型的高效分类方法_2
人工智能·深度学习·分类
岑梓铭37 分钟前
YOLO11深度学习一模型很优秀还是漏检怎么办,预测解决
人工智能·笔记·深度学习·神经网络·yolo·计算机视觉