SFT后训练32B-LLM的一些观察

CoderOnly2026-01-20 14:47

用单一语种数据集SFT

用COIG-CQIA数据集，以及把COIG-CQIA数据集混合guanaco和belle之后的数据集一起SFT 32B-Base模型，或者基于32B-Chat模型SFT（1-3 epoch），

目的是想提升LLM在单一语种的效果，

然后在中文通用评测集CEVAL和CMMLU评测，

效果都不如32B-Chat模型。

用一个NLP数据集SFT

用一个NLP任务的数据集（30W data），SFT 32B-Base模型，或者基于32B-Chat模型SFT（1 epoch），

目的是想把预训练的知识用到这个NLP任务里，

把SFT之后的LLM作为标注这个NLP任务训练数据的标注LLM，

效果还不如通用的32B-Chat模型作为标注LLM。

上一篇：obsidian进阶の插件系列|Templater从小白到菜鸟

下一篇：实验五 spring入门及IOC实验

热门推荐

01GitHub 镜像站点 02【OpenClaw 本地实战 Ep.3】突破瓶颈：强制修改 openclaw.json 解锁 32k 上下文记忆 03OpenClaw 使用和管理 MCP 完全指南 04Claude Code + GLM4.7 避坑指南：解决 Unable to connect to Anthropic services 05AI Agent 平台横评：ZeroClaw vs OpenClaw vs Nanobot 06AI 规范驱动开发“三剑客”深度对比：Spec-Kit、Kiro 与 OpenSpec 实战指南 07Clawdbot部署教程：解决‘gateway token missing’授权问题的完整步骤 08Window 10部署openclaw报错node.exe : npm error code 128 09让 Trae IDE 智能体 “读懂”文档 Excel+PDF+DOCX ：mcp-documents-reader 工具使用指南 10本地部署 OpenClaw + DeepSeek-R1 完全指南