大模型长文生成中的幻觉与事实性:研究进展综述

上一篇笔记介绍了我们提出的KLCF框架:基于知识一致性验证的强化学习框架:提升大模型在长文生成中的事实性

这篇文章分享一个整理的有关大模型长文幻觉与事实性的仓库:Awesome Long-Form Factuality!

它系统整理了大模型长文生成事实性研究的最新进展,包括以下内容:

  • 从问题洞察到评测方法 全面梳理了"幻觉"问题的根源,以及如何量化评估生成文本的事实性。
  • 从提示工程到强化学习 收录了提升事实性的主流技术路径,包括:(1)Prompt工程:如何通过提示词引导模型;(2)微调技术:SFT与DPO等对齐方法;(3)强化学习:RLHF及其变体等多种RL框架;(4)主流评测基准与综述:汇总了该领域的关键评测数据集与权威综述文章

    这个仓库旨在为社区提供一份持续更新的研究路线图,欢迎Star🌟 & PR!
    GitHub链接: https://github.com/ki-ljl/Awesome-Long-Form-Factuality
相关推荐
人道领域8 分钟前
注意!2026大模型风口突变:告别云端军备竞赛,端侧AI才是今年最大黑马
人工智能·大模型·端侧ai
汪海游龙13 分钟前
03.29 AI 精选:面向 PR 的多智能体 AI 代码审查
github
第一程序员17 分钟前
如何在GitHub上找到适合初学者的Python项目
python·github
人工智能小豪21 分钟前
LLM的具身鸿沟有解了!微调让大模型真正学会人类的感官与动作感知
人工智能·ai·llm·prompt·embedding·agent·rag
MadPrinter31 分钟前
GitHub Trending 每日精选 - 2026-03-28
ai·自动化·github·openclaw
ZzT35 分钟前
飞书CLI开源:200+命令让Claude Code直接操控你的飞书
人工智能·llm·claude
我叫张小白。1 小时前
Dify系列(三):提示词工程的Prompt 结构优化与变量设计
ai·大模型·prompt·dify·智能体
楚轩努力变强1 小时前
2026 年前端进阶:端侧大模型 + WebGPU,从零打造高性能 AI 原生前端应用
前端·typescript·大模型·react·webgpu·ai原生·高性能前端
第一程序员1 小时前
非专业转码心路历程与Rust学习规划
python·github
散峰而望1 小时前
【数据结构】单调栈与单调队列深度解析:从模板到实战,一网打尽
开发语言·数据结构·c++·后端·算法·github·推荐算法