技术栈
私有模型训练
海棠AI实验室
15 天前
python
·
私有模型训练
第六章 从“能用”到“能交付”的关键一刀:偏好对齐(Preference Alignment)数据工程
SFT 做完,很多团队会遇到同一个坑:口径不稳、风格漂移、越用越像“随机选项”。 偏好对齐不要求你写“标准答案”,它只问一句:两种回答里,你更偏好哪一种?——然后把你的“交付标准”固化进模型。
海棠AI实验室
18 天前
llm
·
私有模型训练
·
私有大模型训练
第四章 文本数据清洗:去重、分段、规范化、脏词与格式纠错(先把数据“训得动”,再谈模型“训得好”)
你做私训模型,最常见的幻觉是:“数据只要多就行。” 结果训出来:输出更像“复读机”、口径互相打架、离线评测虚高、上线直接翻车。
海棠AI实验室
18 天前
python
·
模型训练
·
私有模型训练
第五章 指令数据怎么写:从“有用”到“可学”的指令模板库
你做私训模型,最容易踩的第一个坑就是: 把“看起来很有用的聊天记录/对话截屏”直接喂给模型。结果模型学到的不是能力,而是三件套:
海棠AI实验室
21 天前
python
·
私有模型训练
第三章 私有数据的“可用性”标准:质量、覆盖、冲突、泄漏与合规
你做私有模型,最容易被忽略的一句话是:模型训练只是“加工”,数据可用性才是“原材料合格证”。如果数据不达标,你再会调参也只能得到: ❌ 不稳定的输出、❌ 漂移的效果、❌ 上线就翻车的“纸面准确率”。
海棠AI实验室
22 天前
python
·
私有模型训练
第二章 硬件与成本:显存预算、吞吐、单次训练成本的工程估算
你做私有模型训练,最常见的翻车不是“不会训”,而是:这篇把“硬件与成本”拆成一套可复用估算方法: ✅ 显存怎么拆(训练 vs 推理) ✅ seq_len / batch / grad_accum 怎么影响显存与速度 ✅ 云端成本账本怎么拆(训练/推理/存储/带宽) ✅ 最后交付:显存估算表(公式)+ 成本测算模板(表格)
海棠AI实验室
22 天前
模型训练
·
私有模型训练
第一章 一张图看懂私有模型训练闭环:数据→训练→评测→上线→监控→迭代
很多人卡在这几个坑:一句话:你缺的是“工程闭环”,不是“更多调参秘籍”。建议:把它放在专栏置顶、仓库 README 第一屏、视频开篇第一张。
我是有底线的