大语言模型(LLM)入门项目推荐

推荐大语言模型(LLM)的入门项目 TiaoYu-1。

https://github.com/tiaoyu1122/TiaoYu-1

项目优点:

  1. 几乎每一行代码(一些重复的代码除外)都添加了注释,详细介绍了代码的作用,方便阅读与理解。
  2. 基本上覆盖了常见 LLM 模型的全部训练流程,包括:预训练、有监督微调(SFT)、人类反馈强化学习(ELHF)、LoRA微调、推理模型训练(Reasoning)、知识蒸馏(KD)等。
  3. 对 LLM 模型的一些关键知识点进行了总结和梳理。
相关推荐
霍格沃兹软件测试开发9 小时前
大语言模型提示词工程教程:实现自动化工具推理
microsoft·语言模型·自动化
lkbhua莱克瓦249 小时前
参数如何影响着大语言模型
人工智能·llm·大语言模型
北京盛世宏博9 小时前
数据可追溯 + 加密传输:以太网温湿度变送器守护涉密档案安全
大数据·运维·人工智能·档案温湿度
阿星AI工作室9 小时前
魔改豆包输入法变电脑版,立即拥有千元AI语音输入法typeless平替
前端·人工智能
wenzhangli79 小时前
SkillFlow:回归本质,重新定义AI时代流程管控
人工智能
m0_603888719 小时前
Over-Searching in Search-Augmented Large Language Models
人工智能·ai·语言模型·自然语言处理·论文速览
狮子座明仔9 小时前
GDPO:英伟达提出多奖励强化学习的“解耦归一化“策略,解决GRPO的优势崩溃问题
人工智能·gpt·语言模型·自然语言处理
rgb2gray9 小时前
论文深度解析:基于大语言模型的城市公园多维度感知解码与公平性提升
大数据·人工智能·机器学习·语言模型·自然语言处理·数据分析·可解释
草莓熊Lotso9 小时前
Qt 信号与槽深度解析:从基础用法到高级实战(含 Lambda 表达式)
java·运维·开发语言·c++·人工智能·qt·数据挖掘
东坡肘子9 小时前
AT 的人生未必比 MT 更好 -- 肘子的 Swift 周报 #118
人工智能·swiftui·swift