如何用清华 ChatGLM 微调一个私域大模型

曹政,曹大是我们圈子里公认的大佬。他在技术上不仅早早领先,在思维认知领域更是帮助很多小伙伴快速成长。

没有 ChatGPT 之前,我一直在想,能否将曹大的思维,直接植入过来,就跟无崖子传输功力,头碰头就行。当然我多想了 !!

ChatGPT 出来后,快速获取通识变得异常高效。但解决问题的思考模型,还是缺少系统性的植入。直到 LLaMa, ChatGLM 开源后,我才发觉,奇点真的可能到了,微调就能达到制作私域内容数字分身的效果。

于是,周末我趁着大块时间,一鼓作气,把微调这个事儿,给办了。用的微调语料当然是曹大的 500+ 篇公众号文章。

以下是我的制作步骤:

  1. 下载清华 ChatGLM 2 6B 的大模型

  2. 下载 github 清华微调套件

  3. 利用 ChatGPT 3.5 制作微调语料

  4. 开始训练 GLM 大模型,得到 checkpoint

下面看看效果:

更详细的测评,我上传到了视频号:

微调前

微调后

对于技术感兴趣的同学,我分享个用 ChatGPT 3.5 打标注,组训练数据集的技巧吧。除了人工标注数据外,GPT 在这方面非常有优势。

下面是我用到的 Prompt:

上面微调前后对比图中,用到的微调语料数据集,就是这段 Prompt 生成的。如果用 GPT 4 的话,效果更好,但费用也更高。

下面带个货,Prompt 如此重要的技能,无论工资涨没涨,买书学技能的银子大家肯定舍得花的,不用 79,一半就成,哈哈哈哈哈:

相关推荐
不会计算机的g_c__b36 分钟前
HuggingGPT深度解析:当ChatGPT遇上HuggingFace,打造AI世界的“万能工具箱”
人工智能·chatgpt
梁辰兴2 小时前
OpenAI更新ChatGPT Images:生成速度最高提升4倍,原生多模态模型
人工智能·科技·ai·chatgpt·大模型·openai·图像生成
感谢地心引力2 小时前
【AI】免费的代价?Google AI Studio 使用指南与 Cherry Studio + MCP 实战教程
人工智能·ai·google·chatgpt·gemini·mcp·cherry studio
Ztop3 小时前
没有发布会,GPT Image 1.5 凌晨发布,实测与Nano Banana2相比,各有优势,但也一言难尽...
gpt·chatgpt
Java后端的Ai之路21 小时前
【智能体搭建平台篇】-Dify部署方案介绍
人工智能·chatgpt·aigc·ai编程
每日学点SEO1 天前
「网站新页面冲进前10名成功率下降69%」:2025 年SEO竞争格局分析
大数据·数据库·人工智能·搜索引擎·chatgpt
海棠AI实验室1 天前
从“会出图”到“能交付”:用 ChatGPT + Nano Banana/Midjourney 做一套现代高校图书馆方案
人工智能·chatgpt·midjourney·图书馆
mCell2 天前
ChatGPT Codex CLI 系统提示词
chatgpt·openai·ai编程
Maynor9963 天前
Claude vs ChatGPT vs Gemini:全方位对比与选用指南
chatgpt
中國龍在廣州3 天前
AI顶会ICML允许AI参与审稿
人工智能·深度学习·算法·机器学习·chatgpt