技术栈
大模型测试
twc829
18 天前
开发语言
·
人工智能
·
python
·
rag
·
大模型测试
Query 改写 大模型测试的数据倍增器
在大模型应用测试中,测试查询的覆盖面往往捉襟见肘。Query 改写(Query Rewrite/Expansion)作为"数据倍增器",能从有限的原始查询衍生出语义等价但表达多变的变体,让测试数据集瞬间膨胀,覆盖更多边缘 case 和真实场景。
twc829
20 天前
服务器
·
数据库
·
人工智能
·
windows
·
rag
·
大模型测试
大模型生成 QA Pairs 提升 RAG 应用测试效率的实践
在测试大模型应用(如 RAG 系统)时,QA 对(Question-Answer Pairs)数据集是第一道防线。它用于验证模型的事实准确性、防范"幻觉"输出以及测试上下文理解能力。
多则惑少则明
4 个月前
人工智能
·
ai测试
·
大模型测试
AI测试、大模型测试(九)spring集成大模型(AI4J)
目录1.1 AI4J简介1.2 支持接入的大模型1.3 示例1.4 AI4J 源代码1.5 更多代码示例(调用openapi大模型)
多则惑少则明
4 个月前
人工智能
·
测试工具
·
ai测试
·
大模型测试
AI测试、大模型测试(五)AI测试工具有哪些
目录一、AI测试工具分类1.1 智能测试生成工具1.2 智能测试执行与优化工具1.3 专项领域AI测试工具
多则惑少则明
4 个月前
人工智能
·
ai测试
·
大模型测试
·
算法测试
AI测试、大模型测试(四)AI测试分类&AI测试岗位分工
目录一、AI测试分类二、AI测试岗位分工说起AI测试可能过于模糊,下面来看看AI测试的分类。常见的分类方式包括按测试类型、测试对象、测试目标或AI应用场景划分。
多则惑少则明
4 个月前
人工智能
·
ai测试
·
大模型测试
AI测试、大模型测试(一)
目录一、AI测试与传统测试的区别二、AI大模型测试的独特挑战三、AI大模型测试对QA的要求1、AI大模型测试中,QA核心工作之一是需要评估从哪些方面评估模型的表现,准备好测试集
我是有底线的