CPQS-TUNING 论文引文阅读

文章目录

  • [一、引言 / 指令微调基础(必看 5 篇)](#一、引言 / 指令微调基础(必看 5 篇))
  • [二、相关工作:数据过滤 / 数据选择(核心对标 4 篇)](#二、相关工作:数据过滤 / 数据选择(核心对标 4 篇))
  • [三、方法动机:隐状态 / 模型内部信号(关键 3 篇)](#三、方法动机:隐状态 / 模型内部信号(关键 3 篇))
  • [四、实验与基准(打榜必引 4 篇)](#四、实验与基准(打榜必引 4 篇))
  • 五、模型与工程(可选但规范)

我直接按你这篇 CPQS‑Tuning 原文的章节逻辑,把参考文献里 最值得读、最经典、最能支撑你论文 的论文,按章节整理好, 标题+年份+一句话推荐理由 ,你写综述直接抄。


一、引言 / 指令微调基础(必看 5 篇)

  1. Training language models to follow instructions with human feedback (InstructGPT, 2022)
    推荐:指令微调 + RLHF 开山之作,所有对齐工作的源头,必须引。
  2. Stanford Alpaca: An instruction-following LLaMA model (Alpaca, 2023)
    推荐:开源指令微调范式鼻祖,你用的 Alpaca‑GPT4 就是它的延伸。
  3. Language models are few‑shot learners (GPT‑3, 2020)
    推荐:基座大模型预训练的里程碑,解释"基座模型为什么需要微调"。
  4. LIMA: Less is more for alignment (2023)
    推荐:高质量小数据胜过大数据,直接支撑你"数据过滤/精选"的动机。
  5. The Flan Collection: Designing data and methods for effective instruction tuning (2023)
    推荐:指令微调数据工程最系统工作,奠定数据质量重要性。

二、相关工作:数据过滤 / 数据选择(核心对标 4 篇)

  1. Alpagasus: Training a better alpaca with fewer data (ICLR 2024)
    推荐:用强 LLM 打分做数据过滤,你论文里直接对比的 SOTA。
  2. MoDS: Model‑oriented data selection for instruction tuning (2023)
    推荐:面向目标模型的数据选择,和你"模型自感知"思路最接近。
  3. Superfiltering: Weak‑to‑strong data filtering for fast instruction tuning (ACL 2024)
    推荐:小模型替大模型过滤,低成本数据筛选标杆,你必对比。
  4. What makes good data for alignment? (ICLR 2024)
    推荐:自动数据选择最全面综述类工作,适合写相关工作。

三、方法动机:隐状态 / 模型内部信号(关键 3 篇)

  1. I've got the "answer"! Interpretation of LLM hidden states in QA (2024)
    推荐:证明隐状态包含质量/正确性信号,直接支撑你 CPQS 核心假设。
  2. Latent space chain‑of‑embedding enables output‑free LLM self‑evaluation (2024)
    推荐:不用生成答案,用隐状态做自我评估,和你思路高度一致。
  3. HSF: Defending against jailbreak attacks with hidden state filtering (WWW 2025)
    推荐:用隐状态做过滤/筛选的实例,证明隐状态可用于数据判别。

四、实验与基准(打榜必引 4 篇)

  1. Measuring Massive Multitask Language Understanding (MMLU, 2021)
    推荐:大模型知识能力最通用基准,你论文必测。
  2. Training verifiers to solve math word problems (GSM8K, 2021)
    推荐:数学推理标准集,你下游任务核心基准。
  3. Evaluating large language models trained on code (HumanEval, 2021)
    推荐:代码生成权威基准,你代码实验必引。
  4. AlpacaEval: An automatic evaluator of instruction‑following models (2023)
    推荐:指令跟随能力自动评测标准,你对话类效果必用。

五、模型与工程(可选但规范)

  1. LLaMA 2: Open foundation and fine‑tuned chat models (2023)
    推荐:开源基座模型标杆,你实验用的 Llama2 来源。
  2. Qwen2.5 technical report (2024)
    推荐:你实验用到的强中文基座,必须标注来源。

极简总结(写论文直接用)

  • 想讲为什么要指令微调:读 InstructGPT、Alpaca、LIMA
  • 想讲为什么要数据过滤:读 Alpagasus、Superfiltering、MoDS
  • 想讲为什么能用隐状态:读隐状态解读 + 自评估那 3 篇
  • 想做评测打榜:读 MMLU、GSM8K、HumanEval、AlpacaEval

需要我把这些整理成可直接粘贴进论文的"Related Work"标准段落吗?

相关推荐
哎呦哥哥和巨炮叔叔1 小时前
GPT-Image-2最优使用渠道推荐:AI1505一站式AI创作平台,解锁创意新可能
人工智能·ai视频生成·gpt-image-2·ai1505平台·ai生图工具·一站式ai创作平台·免费ai生图
AI模力圈1 小时前
多模态理解类模型技术小结
人工智能·多模态
QuestLab1 小时前
【第25期】2026年4月28日 AI日报
人工智能
新知图书1 小时前
LangGraph 基础图创建思路
人工智能·agent·智能体·langgraph·langchian
AI 编程助手GPT1 小时前
GPT-5.5与Claude Opus 4.7编程能力深度对比:2026年4月主流AI编程模型选型指南
大数据·人工智能·gpt·ai·ai编程
小王毕业啦1 小时前
1985.1-2026.1 世界各国经济政策不确定性指数(xlsx)
大数据·人工智能·数据挖掘·数据分析·社科数据·实证数据·经管数据
ai产品老杨1 小时前
解构企业级AI视频中台:基于X86/ARM与GPU/NPU异构架构的深度演进与源码交付实践
arm开发·人工智能·音视频
Godspeed Zhao1 小时前
具身智能中的传感器技术36——RGB-D相机2
人工智能·科技·机器学习·深度相机
G探险者1 小时前
ClawHub 下载量最高的 20 个 Skill 介绍
人工智能