技术栈
minimind
lkforce
3 小时前
笔记
·
机器学习
·
ai
·
预训练
·
minimind
·
train_pretrain
MiniMind学习笔记(三)--train_pretrain.py(预训练)
train_pretrain.py是MiniMind项目中用于预训练的主脚本,负责模型的预训练流程。train_pretrain.py文件整个分了2部分,第一部分是一个函数,
lkforce
9 天前
人工智能
·
算法
·
机器学习
·
token
·
分词器
·
minimind
·
词汇表
MiniMind学习笔记(零)--基础概念
分词器的作用是切分用户输入。比如用户输入 "今天天气怎么样",分词器可能会将其分成数组:["今", "天", "天", "气", "怎", "么", "样"]。根据词汇表不同,不同的模型可能有不同的切法。
lkforce
10 天前
笔记
·
python
·
学习
·
minimind
·
minimindconfig
MiniMind学习笔记(二)--model_minimind.py
目录一,MiniMind Config部分1,MiniMindConfig的父类PretrainedConfig
AI、少年郎
15 天前
人工智能
·
python
·
ai
·
大模型
·
微调
·
大模型训练
·
minimind
MiniMind 第 4 篇:《数据工程|Tokenizer 训练 + 预训练 / SFT/DPO 全数据集处理》
承接上一篇内容:我们拆解了 MiniMind 底层核心架构,吃透了 RMSNorm、SwiGLU、RoPE 三大组件的工程实现与优化逻辑。现在,终于轮到 LLM 最关键的「粮草」—— 数据工程。
lkforce
17 天前
笔记
·
python
·
学习
·
minimind
MiniMind学习笔记--安装部署
如果电脑上没有任何相关组件,安装过程还是挺麻烦的,有各种各样的组件需要安装,还有各种各样的配置需要调整和配置。
changzz2008
1 年前
llm
·
大语言模型
·
minimind
·
低配置
低配置电脑预训练minimind的实践
minimind是一个轻量级的LLM大语言模型,项目的初衷是拉低LLM的学习门槛,让每个人都能从理解每一行代码开始, 从零开始亲手训练一个极小的语言模型。对于很多初学者而言,电脑配置仅能够满足日常工作,为了学习大预言模型,特别是在入门和学习基本原理阶段,用低配置的电脑能不能进行minimind模型的预训练呢?答案是可以,下面笔者一步一步来展示预训练的过程。
狂奔solar
1 年前
大模型
·
minimind
Minimind 训练一个自己专属语言模型
发现了一个宝藏项目, 宣传是完全从0开始,仅用3块钱成本 + 2小时!即可训练出仅为25.8M的超小语言模型MiniMind,最小版本体积是 GPT-3 的 17000,做到最普通的个人GPU也可快速训练
伊织code
1 年前
人工智能
·
语言模型
·
自然语言处理
·
训练
·
minimind
MiniMind - 从0训练语言模型
《AI 技术资讯分享》扫码入群:https://www.yuque.com/yizhi-lentn/zctmmg/xpamt1qpp2xv8q8b
我是有底线的