【GPT入门】第38课 RAG评估指标概述

这里写自定义目录标题

一、RAG评估指标

二、ragas 评估

2.1 ragas介绍

复制代码
开源地址:https://github.com/explodinggradients/ragas
官方文档:https://docs.ragas.io/en/stable/

从文本生成和文本召回两个维度,进行分析:

准确性
生成内容的准确性 :评估生成的文本是否准确回答了问题,是否与相关知识源的信息一致。例如,在回答历史事件问题时,生成的内容应准确反映事件的时间、地点、人物等关键信息。
检索结果的准确性 :考查检索模块能否准确地从知识源中找到与问题相关的信息。比如,当用户询问某一科学理论时,检索系统应能精准定位到包含该理论详细解释的相关文献。
相关性
生成内容与问题的相关性 :判断生成的文本与用户提问的主题和意图是否紧密相关。生成的回答不应偏离问题的核心,要围绕问题的关键要点展开。
检索结果与问题的相关性:衡量检索出的知识与问题的匹配程度。检索结果应直接或间接地与问题所涉及的领域、概念等相关,有助于生成准确且相关的回答。

三、trulens

相关推荐
POLOAPI12 小时前
从模型到生产:AI 大模型落地工程与效率优化实践
人工智能·gpt·gemini
007tg18 小时前
007TG洞察:GPT-5前瞻与AI时代竞争力构建:技术挑战与落地路径
人工智能·gpt·机器学习
nassi_18 小时前
GPT Agent与Comet AI Aent浏览器对比横评
人工智能·gpt
陈敬雷-充电了么-CEO兼CTO21 小时前
字节跳动开源Coze,开启AI Agent开发新时代?
人工智能·gpt·chatgpt·开源·大模型·agi·coze
强德亨上校21 小时前
2025年7月21–28日AI开发周报:新模型、新战略与开源亮点
人工智能·科技·gpt·chatgpt·开源·aigc
努力的小T1 天前
MBR和GPT分区的区别
linux·运维·服务器·gpt·云计算
maray2 天前
GPT 生成一个打字练习页面
gpt
天若有情6733 天前
【技术新闻】OpenAI发布GPT-5,AI编程助手迎来革命性突破
gpt·ai编程·业界资讯·新闻资讯
量子位6 天前
奥特曼首次透露GPT-5上手体验:在擅长领域感到无力,往后一靠感到眩晕
人工智能·gpt
陈敬雷-充电了么-CEO兼CTO6 天前
OpenAI发布ChatGPT Agent,AI智能体迎来关键变革
java·人工智能·python·gpt·chatgpt·大模型·agi