AI工程可能会遇到的一些问题

1,为什么很多RAG项目会失败?

1,检索质量太差,根本没有检索到正确内容

原因:embedding不行,相似度算错,语义没对齐。query没有被改写,完全没有上下文,检索失败。

解法:LLM改写查询,关键词+向量。

2,Chunk切分错误

原因: chunk太大,信息很多,但不相关,模型被噪声干扰。 chunk太小,语义断裂,找不到完整答案。

解法:重叠切分, 按语义切,而不是按字数。

3,top-k策略错误

原因:k太小,找不到信息。 k太大,噪声爆炸。

解法: 重排序,动态调整。

4,Prompt设计不对(模型不会用资料)

原因: 模型不知道"必须用资料",不知道"怎么用"

解法:请严格基于以下资料回答,如果资料中没有答案,请说"无法回答"。

5,数据源本身有问题,

原因:过时,矛盾,错误数据。

解法: 数据清洗,加时间/版本信息,标注来源。

6,评估方式完全错误

原因: 没覆盖边界case, 没有测失败率,没测hallucination.

解法:构建测试集,指标 :retrieval recall(成功检索到的相关结果占所有相关结果的比例) , answer accuracy。

2,Agent什么时候该用,什么时候不该用

适合场景:1,多步骤+不确定路径。2,需要动态调用工具。3,任务无法预先写死流程。4,探索型任务,比如,信息汇总,自动化分析。

不适合场景:1,简单回答。 2,流程固定的任务。3,高可靠性场景,如 金融,医疗,法律。

3,蒸馏 vs 微调 vs RAG(怎么选)

RAG适合,知识经常变,需要"查资料",不想训练模型。

微调适合,任务固定,输出格式重要,想"改变模型"。

蒸馏适合,已有大模型,要做低成本部署,QPS很高,企业私有轻量部署。

4,一个完整LLM系统架构(工业级)

html 复制代码
[1] 接入层(API / UI / Channel)
     👇
[2] 编排层 (Orchestration / Agent Router)
     👇
[3] 认知层 (Prompt + Memory + Tools + RAG)
     👇
[4] 模型层 (LLM / Embedding / Rerank)
     👇
[5] 知识与工具层(Vector DB / sql / search / APIs)
     👇
[6] 观测与治理层 (Logging / Eval / Safety / Cost)

1,接入层:把用户请求标准化。常见入口:web chat, mobile app。 处理内容:鉴权,session id,用户画像加载。

2,编排层: 这是大模型的cpu, 核心功能:任务分流,判断要不要调工具,要不要RAG。Agent Controller,多步执行。拼prompt, 系统提示词,用户输入,记忆,检索文档。

3,认知层,这一层决定像不像"人类"。 提示系统包括行为规则,少样本示例,结构化提示模板。记忆系统包括 当前会话上下文,用户偏好,历史对话摘要。 RAG,检索增强。工具调用,数据库,函数,搜索引擎。

4,模型层。 LLM,Embedding Model, Reranker.

5, 知识与工具层。 向量数据库,结构化数据库,文档存储,搜索引擎, 其他的API接口。

6,观测与治理层。

Logging(全链路记录),记录:prompt,retrivel docs,tool calls, output,latency.

评估系统:幻觉率,召回率,准确率。

安全层:越狱检测,提示词注入,输出控制。

相关推荐
野生的程序媛9 小时前
关于我做了一个玩偶姐姐桌宠
人工智能·深度学习·神经网络·机器学习·chatgpt·ai作画·gpt-3
AI周红伟9 小时前
周红伟:运营商一季度净利集体下滑 Token运营提速
大数据·网络·人工智能
LaughingZhu10 小时前
Product Hunt 每日热榜 | 2026-05-04
人工智能·经验分享·深度学习·神经网络·产品运营
无忧智库10 小时前
研发管理的下一个十年:当多Agent协同遇上知识图谱,传统项目管理体系正在被颠覆(WORD)
大数据·人工智能·知识图谱
mit6.82410 小时前
人类数据 | 行为克隆 | 机器人学习的未来
人工智能·机器人
小饕10 小时前
AI编程的三阶段演化:哪些方向真正值得投入,哪些被高估了
人工智能·ai编程
蔡俊锋10 小时前
把1500个业务的大迁移,做成了可复用流水线用 Skill+Agent+Rule,省下 60 人年的实战复盘
人工智能·skill+agent
ZGi.ai10 小时前
AI中台和AI工具的区别:为什么说前者是基础设施而后者是应用
人工智能·chatgpt·ai工具·ai基础设施
飘落的数码折腾日记10 小时前
OpenClaw 是什么?让 AI 真正 “动手“ 帮你干活的秘密武器
人工智能
fthux10 小时前
用了 GitZip 这么多年,我动手做了一个「Pro」版
人工智能·开源·github