【GPT入门】第38课 RAG评估指标概述

这里写自定义目录标题

一、RAG评估指标

二、ragas 评估

2.1 ragas介绍

复制代码
开源地址:https://github.com/explodinggradients/ragas
官方文档:https://docs.ragas.io/en/stable/

从文本生成和文本召回两个维度,进行分析:

准确性
生成内容的准确性 :评估生成的文本是否准确回答了问题,是否与相关知识源的信息一致。例如,在回答历史事件问题时,生成的内容应准确反映事件的时间、地点、人物等关键信息。
检索结果的准确性 :考查检索模块能否准确地从知识源中找到与问题相关的信息。比如,当用户询问某一科学理论时,检索系统应能精准定位到包含该理论详细解释的相关文献。
相关性
生成内容与问题的相关性 :判断生成的文本与用户提问的主题和意图是否紧密相关。生成的回答不应偏离问题的核心,要围绕问题的关键要点展开。
检索结果与问题的相关性:衡量检索出的知识与问题的匹配程度。检索结果应直接或间接地与问题所涉及的领域、概念等相关,有助于生成准确且相关的回答。

三、trulens

相关推荐
牛肉汤1 天前
从零构建大语言模型
gpt
AIBox3651 天前
codex api 配置教程:安装、鉴权、Windows 环境变量
javascript·人工智能·windows·gpt
JavaPub-rodert2 天前
[特殊字符] 2026年国内 Codex 安装教程和使用教程:GPT-5.4 完整指南(新手也能10分钟上手)
gpt·ai·codex
Ztopcloud极拓云视角3 天前
Gemini 3.1 Pro vs GPT-5.4 Pro:API成本1/3、性能差多少?选型实测笔记
人工智能·笔记·gpt·ai·语言模型
ofoxcoding3 天前
GPT-5.4 vs Claude Opus 4.6 实测对比:2026 年该选哪个模型写代码?
网络·gpt·ai
JAVA_HOME_NEW3 天前
macbook 配置claude code 通过copilot api调用 claude模型及gpt模型
gpt·copilot
健康人猿3 天前
Business 降价导致 Codex 额度减少?GPT 各类套餐在 Codex 的使用限制是多少?
人工智能·gpt·chatgpt
郑板桥303 天前
一周AI热点速览(2026.03.31-04.06):GPT-6曝光、谷歌开源Gemma 4、资本狂飙与模型军备竞赛
人工智能·gpt·aigc