前言
在家休息了半年,半年没学习新的东西,AI 迅猛发展,感觉已经与外界格格不入,可以申请非物质文化遗产了。

人都是时代的产物,人在这个时代滚滚洪流面前连一粒沙子都算不上。把握好时代趋势,为了拥抱 AI 时代,从今天开始打开停更半年的博客,恢复持续学习的能力,学习和输出 AI 相关的内容,防止沦为笑话(开除速度一定要快)。

言归正传,从 AI 基础开始学起。
AI基础概念扫盲
如图所示:

1. 核心基础层
这是AI的"地基",所有AI能力都建立在这些概念之上。
-
LLM(大语言模型)
- 就像一个读过海量书籍,看过无数网页的"超级学霸",能听懂人话、写文章、写代码、回答问题。我们平时用的豆包、GPT、Claude,背后都是它。
-
Prompt(提示词)
- 你对AI说的话、提的要求,就是提示词。比如"帮我写一篇旅游文案"或"解释一下什么是RAG",AI就是根据这些指令来干活的。
-
Context(上下文)
- 对话的"短期记忆"。比如你先问"北京有什么景点",再问"那附近有什么好吃的",AI能知道你问的是北京附近,就是因为它记住了之前的上下文。
-
Memory(记忆)
- 比上下文更持久的"长期记忆"。比如你告诉AI"我喜欢科幻小说",它之后给你推荐书时就会优先考虑科幻,这就是记忆在起作用。
-
Token(令牌)
- AI处理文字的"最小单位",可以理解成AI的"字数"。比如中文里一个词或一个字,英文里一个单词片段,都可能是一个Token。AI的回答长度、收费多少,都和Token数量有关。
2. 能力增强层
在地基之上,给AI装上各种"超能力",让它更聪明、更有用。
-
RAG(检索增强生成)
- 让AI在回答前,先去一个"专属知识库"里查资料,再结合资料来回答。这样它就不会胡说八道,回答更准确,也能用到你自己的私有数据。
-
Search(搜索)
- 就是让AI像用搜索引擎一样,去互联网上实时查找最新信息,然后再整理成答案。
-
Function Calling(函数调用)
- 比如你让AI"查一下明天的天气",它就会调用天气查询的函数,把结果拿回来再告诉你。
-
Fine-tuning(微调)
- 用你自己的专属数据,对大模型进行"再培训",让它更懂你的行业、你的业务,回答更贴合你的需求。
3. 应用架构
用这些工具和框架,把AI能力搭建成可用的应用。
-
Langchain
- 一个非常流行的AI开发框架,就像一个"乐高积木箱",里面有各种现成的模块(记忆、检索、工具调用等),开发者可以快速拼出一个复杂的AI应用。
-
MCP(模型上下文协议)
- 一个让AI和各种工具、数据、系统之间顺畅沟通的"通用翻译器",能够从外部系统获取信息。
-
Workflow(工作流)
- 完成一个任务的固定步骤。比如"写一篇公众号文章"的工作流可能是:确定主题→搜集资料→写初稿→润色→排版发布。
-
SKILL(技能)
- 给AI Agent赋予的特定能力,比如"订酒店""写周报""分析财报",每个技能都是一套预设的操作流程。
-
PLUGIN(插件)
- 可以理解为将你本地部署的AI工具打包,一次性给其他人,这样其他人安装就可以使用。
-
API接口
- 让AI和其他软件"对话"的桥梁。比如你开发的App,可以通过API接口调用大模型的能力,让你的App也变得智能。
4. 智能体Agent生态
这是AI从"回答问题"进化到"自主完成任务"的关键。
-
Agent(智能体)
- 一个能自己思考、自己行动的AI小助手。它不只是回答问题,还能帮你查资料、订机票、写代码,甚至自己规划步骤去完成一个复杂任务。
-
SubAgent(子智能体)
- Agent手下的"小工"。当一个复杂任务(比如"策划一场婚礼")被拆解后,会交给不同的SubAgent去完成,比如一个负责找场地,一个负责联系司仪。
-
Multi-Agent(多智能体协作)
- 多个Agent像一个团队一样分工合作,共同完成一个复杂的大任务。
5. 工具与项目
这些是具体的产品和项目,用来实现上面的各种概念。
-
AI Agent工具
- Moltbot / Clawdbot / OpenClaw / Trae / iFlow / Manus / Antigravity / AutoGPT / Gemini:这些都是基于大模型开发的AI Agent或工具项目,专注于自动化和复杂任务处理。比如AutoGPT就是一个能自己设定目标并执行的经典Agent。
-
代码增强工具
-
Claude Code:Anthropic公司Claude模型的代码能力增强版,专门用来写代码、查Bug、解释代码。
-
Cursor:一款集成了AI的代码编辑器,能帮你写代码、重构代码、解释代码,大大提升编程效率。
-
6. 底层支撑
这些是AI运行的"基础设施",没有它们AI就跑不起来。
-
GPU算力
- AI的"超级大脑",专门用来处理海量数据和复杂计算。训练大模型、运行AI应用,都需要强大的GPU算力支持。
-
Vector Database(向量数据库)
- 专门用来存储和检索AI生成的"向量数据"的数据库,是RAG技术的核心组件,能让AI快速找到最相关的资料。
-
Embedding(嵌入)
- 把文字、图片等信息转换成AI能理解的数字向量的技术,是AI理解和处理信息的基础。
AI 应用场景
公司可以全流程导入AI,提高工作效率。
- 项目评估阶段,AI协助你进行评估,判断流程和技术风检点
- AI检查评估阶段文本的语法错误,英文拼写错误。
- 当你的助理,协助减少人工检查item,提供搜索查询服务。
- AI自动生成软件需要做的UT/IT测试项
- AI扫描有风险的解答项。
- AI协助你写code,超级智能代码补全,随时询问API用法,自z动生成代码,解释代码,自动添加注释
- AI进行codereview,并将该功能接入checkin系统自动扫描不合规代码。
- AI自动分析bug的问题log,并尝试解决问题,或者给出初步分析。
- 当遇到bug时候,AI自动检索过往相关问题单给你参考。
- AI当FAQ机器人使用(RAG技术)
- AI可以写报告,翻译,全篇翻译英文手册,句子改写等文档类工作。
- AI联网并接入公司内部wiki系统后,可以自动检索公司内部资源,并给出解答。
- 大公司中,AI帮助查找moduleowner
- 自动总结会议纪要
AI技术落地方向:
- GAI生成式AI
- RAG
- COT微调(finetuning),技术点:全量微调,LoRA,QLoRA, prefix tuning, adaprer
- MCP接口技术+skills+提示词
- ACE自动概念提取
- N8N协助PM做流程管理
- 多模态,agent
- 指令工程(promptengineering)
- 正在商用落地的AI应用开发三大方向
正在商用落地的AI应用开发三大方向:

