技术栈
大语言模型幻觉
zsq
1 天前
论文阅读
·
笔记
·
nlp
·
大语言模型幻觉
【论文阅读笔记】HaDes幻觉检测benchmark
LLM幻觉检测现有方法缺点:提出 令牌级(token-level)、无参考(reference-free) 的幻觉检测任务,无需依赖外部参考文本,直接检测文本中单个令牌的幻觉风险。同时,构建了上述任务的数据集 HaDes。构建流程如下: