【LLM】从零预训练一个tiny-llama

宏辉2024-09-27 11:20

文章目录

从零预训练一个tiny-llama
- [1. 数据集](#1. 数据集)
- [2. 数据预处理](#2. 数据预处理)
- [3. 训练模型](#3. 训练模型)
- [4. 项目结构介绍](#4. 项目结构介绍)
- [5. 运行项目示例](#5. 运行项目示例)
- 学习总结

从零预训练一个tiny-llama

参考项目：https://github.com/KMnO4-zx/tiny-llm

数据集：https://www.modelscope.cn/datasets/AI-ModelScope/TinyStories

1. 数据集

2. 数据预处理

3. 训练模型

4. 项目结构介绍

5. 运行项目示例

学习总结

本次掌握了数据集的预处理，并对预处理后的数据进行训练。了解模型如何基于已有的上下文生成后续 token 的机制。

上一篇：前端常见算法题集

下一篇：堆的数组实现

热门推荐

01BongoCat - 跨平台键盘猫动画工具 02GitHub 镜像站点 03UV安装并设置国内源 04Linux下V2Ray安装配置指南 05两千字总结：Codex 国内如何安装和使用的教程，以及如何设置中文回答 06KGG转MP3工具|非KGM文件|解密音频 07荣耀手机2025年10月发布的新品Magic8比起Magic7，在硬件、性能、价格等上有什么区别，有什么优势 08windows找不到gpedit.msc（本地组策略编辑器）09GitLab 零基础入门指南：从安装到项目管理全流程 10NVIDIA显卡驱动、CUDA、cuDNN 和 TensorRT 版本匹配指南