【GPT入门】第38课 RAG评估指标概述

这里写自定义目录标题

一、RAG评估指标

二、ragas 评估

2.1 ragas介绍

复制代码
开源地址:https://github.com/explodinggradients/ragas
官方文档:https://docs.ragas.io/en/stable/

从文本生成和文本召回两个维度,进行分析:

准确性
生成内容的准确性 :评估生成的文本是否准确回答了问题,是否与相关知识源的信息一致。例如,在回答历史事件问题时,生成的内容应准确反映事件的时间、地点、人物等关键信息。
检索结果的准确性 :考查检索模块能否准确地从知识源中找到与问题相关的信息。比如,当用户询问某一科学理论时,检索系统应能精准定位到包含该理论详细解释的相关文献。
相关性
生成内容与问题的相关性 :判断生成的文本与用户提问的主题和意图是否紧密相关。生成的回答不应偏离问题的核心,要围绕问题的关键要点展开。
检索结果与问题的相关性:衡量检索出的知识与问题的匹配程度。检索结果应直接或间接地与问题所涉及的领域、概念等相关,有助于生成准确且相关的回答。

三、trulens

相关推荐
tmy_starlight8 小时前
2025年全新 GPT 4.5 AI 大模型 国内免费调用
ide·gpt·编辑器
一个不秃头的 程序员2 天前
如何在24G显存机器上搭建一个超过gpt效果的DeepSeek-R1?
gpt
soso(找工作版2 天前
【kafla扫盲】FROM GPT
gpt
依旧天真无邪3 天前
利用GPT实现油猴脚本—网页滚动(优化版)
gpt·个人开发
偷偷折个角︿3 天前
GPT官网/官方入口在哪?国内如何流畅使用ChatGPT?最新镜像站与使用指南
人工智能·gpt·ai·chatgpt
soso(找工作版3 天前
【链表扫盲】FROM GPT
python·gpt·链表
kkai人工智能4 天前
DeepSeek的100个应用场景
人工智能·gpt·学习·chatgpt
TGITCIC5 天前
深夜突发:OpenAI紧急修复GPT-4o“献媚”问题
人工智能·gpt·大模型·openai·agi·gpt4o·人工智能趋势
china10005 天前
大模型系列(三)--- GPT1论文研读
人工智能·gpt