分享|instructionfine-tuning 指令微调是提高LLM性能和泛化能力的通用方法

《生成式AI导论》课程中,李宏毅老师提到一篇关于" instruction fine-tuning" 指令微调的论文:

《Scaling Instruction-Finetuned Language Models》

摘要分享:

事实证明,

在一组以指令形式表达 的数据集上微调 语言模型可以提高模型性能和对看不见的任务的泛化

在本文中,我们探讨了指令微调,特别关注

(1) 扩展任务数量,

(2) 扩展模型大小,以及

(3) 对思维链数据进行微调。

我们发现,具有上述方面的指令微调极大地提高了各种模型类(PaLM、T5、U-PaLM)、提示设置(零样本、少样本、CoT)和评估基准(MMLU、BBH、TyDiQA、MGSM、开放式生成)的性能。

例如,在 1.8K 任务上进行指令微调的 Flan-PaLM 540B 性能大大优于 PALM 540B(平均+9.4%)。Flan-PaLM 540B 在多个基准测试中实现了最先进的性能,例如在五次 MMLU 上达到 75.2%。我们还公开发布了 Flan-T5 检查点,即使与更大的模型(如 PaLM 62B)相比,它也能实现强大的小样本性能。

总的来说,指令微调是提高预训练语言模型的性能和可用性的通用方法。

原文链接:

[2210.11416] Scaling Instruction-Finetuned Language Models

相关推荐
Eastmount7 分钟前
[论文阅读] (38)基于大模型的威胁情报分析与知识图谱构建论文总结(读书笔记)
论文阅读·人工智能·大模型·知识图谱·威胁情报
智源研究院官方账号11 分钟前
更强劲,更高效:智源研究院开源轻量级超长视频理解模型Video-XL-2
人工智能·开源
要努力啊啊啊35 分钟前
GQA(Grouped Query Attention):分组注意力机制的原理与实践《一》
论文阅读·人工智能·深度学习·语言模型·自然语言处理
m0_748245171 小时前
KrillinAI:视频跨语言传播的一站式AI解决方案
人工智能·音视频
原味奶茶_三分甜1 小时前
Qwen3高效微调
深度学习
说私域1 小时前
定制开发开源AI智能名片S2B2C商城小程序在无界零售中的应用与行业智能升级示范研究
人工智能·小程序·开源·零售
蹦蹦跳跳真可爱5891 小时前
计算机视觉处理----OpenCV(从摄像头采集视频、视频处理与视频录制)
人工智能·python·opencv·计算机视觉·音视频
Icoolkj1 小时前
微软推出 Bing Video Creator,免费助力用户轻松创作 AI 视频
人工智能·microsoft·音视频
s153351 小时前
9.RV1126-OPENCV 视频的膨胀和腐蚀
人工智能·opencv·计算机视觉
嘻嘻哈哈OK啦4 小时前
day40打卡
人工智能·深度学习·机器学习