AI应用(3)-基础概念的理解

前面两篇说了几个规则概念,下面对上面几个概念做一个总结吧

prompt

这个概念以前我也不懂,最近查了一些资料总结了一下,他其实是一个集合,相当于你发给模型的文本内容,其中包括了system(由程序控制,每次发给大模型的),然后就是user(用户问题),然后就是assistant(由程序控制,每次发给大模型的)。temperature/top_p/max_tokens更准确来说,应该叫生成参数。 (这是说,这些参数也会在每次请求都发给大模型,由程序控制,每次发给大模型的),如果你开发的是一个智能体,那这个事情就是智能体去做的,所有LLM总体要做的其实是接收信息,然后返回信息而已。

上下文管理

之前一篇说过上下文窗口,那个是非常浅显的理解,如果真的要做AI应用,还需要设计到上下文的管理,因为每次调用模型的时候,都要把历史记录发送给大模型去看,模型本身是不会有记忆的,上下文窗口又有限,除非你有很高的算力,不然你全部一股脑的全部发过去,花费的token高,模型理解回答也慢,信息多了,模型回答的也不准,一般情况下,都是需要对上下文进行裁剪,然后发送给大模型去回答。

针对不同场景,可能需要提取的关键信息不同,比如针对智能客服类,你需要提取的就是用户的身份信息,关键订单信息、用户已经给过的固定规则、以及本次对话的目的。

一般情况下,上下文的裁剪,第一个原则是保留最近N轮对话数据+关键字段卡片,也可只保留最近N轮对话,这个根据具体情况而定

如果需要长期记忆的话,就需要走RAG查询,这个后面会介绍到。

其他需要注意的点

  • 输出控制和可用性:这个主要是模型返回数据结构化输出,方便前端渲染,后端处理
  • 引用/证据:要求模型回答的时候,都有据可依,降低胡编乱造
  • 拒答/提示信息:要求模型要学会拒绝,不知道的问题要回答不知道,然后提示用户下一步应该去怎么做,去自己查还是说去联系人工客服之类的提示建议。

企业里面一般怎么分工

到这里,可能还是有点模糊,我是搞后端的,我主要负责干嘛?其实把大模型抛开,企业里面一般分为这些角色,大概的吧,不一定准:

  • 后端/平台开发:实现对话管理(存储、裁剪、摘要、token控制、限流、日志)
  • 算法/AI应用工程师:设计prompt、策略、评估集,调参,设计 RAG/Agent 流程
  • 产品/业务:定义"哪些信息是关键""哪些规则必须遵守""输出格式长什么样"

如果是小团队,可能就是一个人做

相关推荐
妙妙屋(zy)10 小时前
Claude Code+CC-Switch+CC-Connect+飞书使用教程
ai
小七-七牛开发者13 小时前
Coding Agent 规则管理:CLAUDE.md、Skills、Hooks、Subagents 到底怎么选?
ai·大模型·agent·claude·token·loop·mcp·claudecode·ai coding
doiito19 小时前
左脚踩右脚:让 LLM 自进化的 Agent 轨迹训练法——为什么它能补上主流范式的最后一块拼图
ai·系统设计
带刺的坐椅1 天前
从 Claude Code 隐私争议,看 SolonCode 的设计选择
ai·llm·agent·claudecode·soloncode·codingplan
lincats1 天前
Claude Code项目越写越乱?这套清理流程能救你
ai·ai agent·claude code
云燕实验室CloudLab2 天前
《AI开始"抱团"思考了!多智能体 + 思维图到底有多强?》
ai·学习工具·智慧学伴
小七-七牛开发者2 天前
论文解读:DeepSeek DSpark 在真实高并发推理服务中,如何保证 Token 生成又好又快?
ai·大模型·编程·ai coding
doiito2 天前
【Agent Harness】Gliding Horse 核心设计理念,不跟风开发自己的AI Agent
ai·rust·架构设计·系统设计·ai agent
doiito3 天前
【Agent Harness】Gliding Horse 的 L2 作战地图:让多 Agent 协作从“摸黑”变成“透明”
ai·rust·架构设计·系统设计·ai agent
xiezhr3 天前
逛GitHub发现一款免费带有AI功能的数据库管理工具DBX
ai·开源软件·自然语言·数据库管理工具