技术栈

大语言模型幻觉

zsq
1 天前
论文阅读·笔记·nlp·大语言模型幻觉
【论文阅读笔记】HaDes幻觉检测benchmarkLLM幻觉检测现有方法缺点:提出 令牌级(token-level)、无参考(reference-free) 的幻觉检测任务,无需依赖外部参考文本,直接检测文本中单个令牌的幻觉风险。同时,构建了上述任务的数据集 HaDes。构建流程如下: