大模型长文生成中的幻觉与事实性:研究进展综述

上一篇笔记介绍了我们提出的KLCF框架:基于知识一致性验证的强化学习框架:提升大模型在长文生成中的事实性

这篇文章分享一个整理的有关大模型长文幻觉与事实性的仓库:Awesome Long-Form Factuality!

它系统整理了大模型长文生成事实性研究的最新进展,包括以下内容:

  • 从问题洞察到评测方法 全面梳理了"幻觉"问题的根源,以及如何量化评估生成文本的事实性。
  • 从提示工程到强化学习 收录了提升事实性的主流技术路径,包括:(1)Prompt工程:如何通过提示词引导模型;(2)微调技术:SFT与DPO等对齐方法;(3)强化学习:RLHF及其变体等多种RL框架;(4)主流评测基准与综述:汇总了该领域的关键评测数据集与权威综述文章

    这个仓库旨在为社区提供一份持续更新的研究路线图,欢迎Star🌟 & PR!
    GitHub链接: https://github.com/ki-ljl/Awesome-Long-Form-Factuality
相关推荐
小七-七牛开发者1 小时前
论文解读:DeepSeek DSpark 在真实高并发推理服务中,如何保证 Token 生成又好又快?
ai·大模型·编程·ai coding
Darling噜啦啦4 小时前
上下文工程实战:从 Prompt 到 Harness 的三次 AI 工程化浪潮
llm·ai编程
远航_5 小时前
git submodule
前端·后端·github
fthux7 小时前
如果你用 Mac,那你可能需要 Noti Shift
macos·开源·github
Hyyy1 天前
Function Calling / Tool Use的原理和实现模式
前端·llm·ai编程
智泊AI1 天前
Loop Engineering 为什么会出现?一个 Loop 的组成部分有哪些?
llm
程序员天天困1 天前
Loop Engineering 实战:/goal 命令让 AI 自己写完整项目
github
徐小夕1 天前
我们开源了一款“框架无关”的思维导图编辑器,3分钟集成到任意系统
前端·javascript·github
小爷毛毛_卓寿杰1 天前
我把 397B 的「Agentic 大脑」塞进了 Xinference,一键部署 Nex-N2
人工智能·架构·github
小爷毛毛_卓寿杰1 天前
我把一个 3B 模型塞进了 Xinference,然后它干掉了 DeepSeek V3.2
人工智能·开源·github