大模型长文生成中的幻觉与事实性:研究进展综述

上一篇笔记介绍了我们提出的KLCF框架:基于知识一致性验证的强化学习框架:提升大模型在长文生成中的事实性

这篇文章分享一个整理的有关大模型长文幻觉与事实性的仓库:Awesome Long-Form Factuality!

它系统整理了大模型长文生成事实性研究的最新进展,包括以下内容:

  • 从问题洞察到评测方法 全面梳理了"幻觉"问题的根源,以及如何量化评估生成文本的事实性。
  • 从提示工程到强化学习 收录了提升事实性的主流技术路径,包括:(1)Prompt工程:如何通过提示词引导模型;(2)微调技术:SFT与DPO等对齐方法;(3)强化学习:RLHF及其变体等多种RL框架;(4)主流评测基准与综述:汇总了该领域的关键评测数据集与权威综述文章

    这个仓库旨在为社区提供一份持续更新的研究路线图,欢迎Star🌟 & PR!
    GitHub链接: https://github.com/ki-ljl/Awesome-Long-Form-Factuality
相关推荐
DigitalOcean28 分钟前
GPU对比:MI350X、MI325X、MI300X、H200、H100
llm·aigc
数据智能老司机1 小时前
使用 MCP 与 A2A 设计多智能体 AI 系统——与 Model Context Protocol(MCP)生态系统集成
llm·agent
数据智能老司机2 小时前
使用 MCP 与 A2A 设计多智能体 AI 系统——构建一个基于工具的智能体 AI 框架
llm·agent
数据智能老司机2 小时前
使用 MCP 与 A2A 设计多智能体 AI 系统——理解 AI 智能体如何工作
llm·agent
Baihai_IDP6 小时前
回头看 RLHF、PPO、DPO、GRPO 与 RLVR 的发展路径
人工智能·llm·强化学习
智泊AI6 小时前
一口气讲清:AI Agent 八大核心概念,建议收藏!
llm
崔庆才丨静觅6 小时前
Claude Code GitHub Actions 使用教程
github·api·claude
Sailing6 小时前
LLM 调用从 60s 卡死降到 3s!彻底绕过 tiktoken 网络阻塞(LangChain.js 必看)
前端·langchain·llm
阿里云大数据AI技术1 天前
用 SQL 调大模型?Hologres + 百炼,让数据开发直接“对话”AI
sql·llm