Python从零到一构建GPT模型

只用Python和 torch框架,从零到一构建GPT模型,对大语言模型入门,了解GPT的内部网络结构,是一个很好示例。

Build_GPT_from_Scratch.ipynb

相关推荐
沛沛老爹13 小时前
Advanced-RAG原理:RAG-Fusion 检索增强生成的多查询融合实战
langchain·llm·agent·fusion·rag·advanced·web转型
阿正的梦工坊14 小时前
论文阅读WebDancer: Towards Autonomous Information Seeking Agency
论文阅读·人工智能·深度学习·机器学习·llm
带刺的坐椅1 天前
迈向 MCP 集群化:Solon AI (支持 Java8+)在解决 MCP 服务可扩展性上的探索与实践
java·ai·llm·solon·mcp
xhxxx1 天前
你的 AI 为什么总答非所问?缺的不是智商,是“记忆系统”
前端·langchain·llm
智泊AI1 天前
一文看懂AI大模型的核心模块:基于强化学习的偏好对齐原理及其应用
llm
CoderJia程序员甲1 天前
GitHub 热榜项目 - 日榜(2025-12-24)
ai·开源·llm·github
亚里随笔1 天前
突破性框架TRAPO:统一监督微调与强化学习的新范式,显著提升大语言模型推理能力
人工智能·深度学习·机器学习·语言模型·llm·rlhf
www_stdio1 天前
让大语言模型拥有“记忆”:多轮对话与 LangChain 实践指南
前端·langchain·llm
重铸码农荣光1 天前
别再让大模型“胡说八道”了!LangChain 的 JsonOutputParser 教你驯服 AI 输出
langchain·llm·aigc
程序员柒叔1 天前
Langfuse 项目概览
大模型·llm·prompt·可观测性·llm评估