
概念先行
LLM大模型:大语言模型
- 够理解和生成人类语言的 AI 系统
- 读过海量书籍和代码的超级学霸,它见过无数的编程案例
- ChatGPT、Claude、Gemini、DeepSeek 都是大语言模型
- 视觉模型(Stable Diffusion)、处理语音的音频模型(Whisper)、以及能同时处理文字、图片、音频的多模态模型(如 GPT-4o、Gemini)
token:词块
- 现在咱们说ai烧钱,本身是token消耗过快导致的
- 用心编写简洁清晰的提示词,让 AI 一次就能理解你的需求,减少反复对话
prompt:提示词*
也可以简单理解为:提出来的问题,要求
- ai写提示词:你说我想要什么,具体明确,包含背景,说出期望
- 自己的背景:我是谁,爱好,职业,背景
- 系统提示词:设置 AI 的角色和行为规则:你是一个**,现在都默认设置了,方便定位ai思考逻辑,输出的标准
context:上下文
所有的参考信息:背景、提示、之前的历史
- 一次能 "记住" 的最大内容量,用 Token 来衡量
- 不同模型上下文窗口大小不同
- 越大,AI 能处理的代码量就越多,能记住的对话历史就越长,成本越高
- 当前对话的历史、打开的代码文件、项目的结构和配置、提供的参考资料
Agentic Engineering智能体工程
- 作为老板大大你要按流程来,自己不能乱,先想清楚要干嘛、写好方案、拆好任务,再把活交给 AI 去执行,它干完了你还得验收,质量不行再打回去重做
Agent Teams 智能体团队
这是大家疯狂在做,也是我正在尝试的内容,集大成者
Background Agent
这个定时任务已经帮很大短视频创作者们做了很多热点工作捕捉、消息提醒等等很多事情,大家也要在激流中涌进,尽量别被拍在沙滩上!
Hooks 钩子
- 自动化触发器,不过要仔细配置,别搬石头砸自己的脚
- 当完成某个动作:生成、提交代码,运行命令,hook自动执行预设的脚本or 检查程序
ReAct 推理与行动
"思考 - 行动 - 观察":ai核心科技之一
-
先推理:现在是个什么情况,我看看是怎么个事;思考当前情况,制定计划
-
再行动:好的,咱们来试试看怎么解决;执行具体操作
-
观察结果:做完了,检查下成果,看看行动效果如何
-
继续推理:效果可能差强人意,咱们根据结果调整策略
MCP 模型上下文协议
- 预定大于配置,咱定好了协议,该怎么做不要乱了规矩
- "USB 接口",让各种外部工具(文件管理、数据库、搜索引擎等)都能用同一种方式连接 AI
AGENTS.md项目指令
- 跨工具通用的开放标准,给 AI 编程智能体提供项目指令
- 项目的构建和启动命令、测试运行方式、代码风格和规范、项目结构说明
memory:记忆
压缩的之前的上下文
Agent Skills 智能体技能
- 生态:说明书、规范
- 各种充血技能包,有精心设计的提示词、代码脚本、还有各种资源文件......你就用吧
借助SKILL.md文件的文件夹,放置指令说明、脚本代码、参考资料等。当遇到相关任务,自动加载对应的 Skill增强自己能力
智能体agent
搜索,上网
search向量数据库
语义相近的片段找出来
语义匹配向量化信息,加入上下文
RAG检索增强生成
- ai先检索外部知识,基于此生成回答,更准确,有依据
- 消除幻觉,减少胡说八道
反射机制
反射提示词
外部反馈/消息,更多事实
function calling
隐患:
大量的数据为依据、为前提:仍需要人为判断筛选
- 安全问题,像之前的电影一样:人伦问题仍然存在哒
- 上下文问题:任务环环相扣、一步错 步步错
- 规范不好、容易跑偏,甚至触发红线
