2025年终总结:AI浪潮下的一年

阔别三年,久违了

Hi,大家好呀。已经很久没在掘金上写文章了,上次发文章,也是三年前的事了。这三年也不是没想过写点什么,但每次打开编辑器,敲几行字又删了...

可能"也许没什么好记录的吧"。哈哈~

今年有些不一样:这一年做的事情,可能是我这几年工作以来比较有"沉淀和进步"的一年。AI的浪潮真正席卷到了我们日常工作的每一个角落。从年初的观望,到年中的All in,再到现在真正落地了一些能力。

所以,25年的最后一天是值得记录下来,给这一年画个完美句号。

当然哈,除了技术方向上的一些唠叨,也开心的聊聊这一年的生活、还有一些零碎的感悟。

如果可以,听首歌,慢慢看。

生活:最大的变化,是角色的转换

在消失的三年中,我成了家。有了一个可爱的女儿"柚柚"。

说实话,当爸爸这件事,比写任何代码都难。代码不行可以重写,bug可以debug,但小朋友的每一个哭声、每一次发烧,我都很局促...

女儿刚出生的那几个月,我经历了人生中最混乱的时期。白天在公司开会、写代码、处理线上问题;晚上回家换尿布、冲奶粉、哄睡觉。有一次凌晨2、3点,女儿发高烧,第一次面临这个问题手忙脚乱,夜里开车带着小孩去医院急诊。那种揪心,着急,相信每个新手爸妈都会和我一样,不知所措。

也分享一些没体验过的时刻:

  • 她第一次对着我笑,嘴角弯弯的,眼睛亮亮的;
  • 她会用小手抓住我的手指,攥得紧紧的不肯放;
  • 她会"啊啊"地跟我"对话",虽然听不懂,但我每次都认真回应。有时候加班回家晚了,她已经睡着了。我就在床边坐一会儿,看着她的小脸,觉得一天的疲惫都消散了,很开心。

成家、当爸爸,这些事情让我更加有动力给她们更好的生活。这对我来说弥足珍贵

技术:核心三件事

今年工作上最大的感受:AI从"能用"到"好用",要走的路很长,做的事很多。

年初那会儿,大模型已经火了快一年,各种Agent框架、RAG方案遍地开花,再加上DeepSeek横空出世带来的冲击,感觉AI的门槛一下子被拉低了:好像谁都能花三天时间搭一个"智能助手"出来。

但真正想把AI落到实际业务里时,会发现:跑通一个demo和做出一个能用的产品,完全是两回事。所以这一年主要做了三件事:搭知识库、建Multi-Agent架构、做上下文工程。

首先是知识库 - 让AI"懂业务"

大模型最大的问题是什么?它什么都知道一点,但对你的业务一无所知。

我涉及的场景是测试领域------需求文档、接口文档、历史测试用例、业务规则......这些知识散落在各个系统里,格式不一,质量参差不齐。直接丢给大模型,它根本理解不了。所以第一件事,是搭建一套企业级的知识库。

核心思路:"先结构化,再向量化":

  • 知识入库:把各种来源的文档统一采集,做清洗、去重、脱敏

  • 语义增强:不是简单存原文,而是提取实体、关系、关键信息,形成结构化的知识单元

  • 多维向量:不同粒度的内容用不同的向量策略------句子级捕捉语义细节,段落级理解上下文,文档级把握整体主题

  • 混合检索:向量检索 + 关键词检索 + 规则过滤,多路召回再统一排序

做完这套,AI的回答就不再是泛泛而谈的看似正确的废话了~

这里贴一些图吧:

系统架构

数据处理

紧接着就是Multi-Agent - 复杂任务规划协作

为什么会需要到 Multi-Agent呢?单个Agent能做的事是有限的。当任务变的比较复杂的时候:比如"读懂一份需求文档,提取测试点,生成测试用例,还要参考历史Case"塞进一个Agent里,prompt是很爆炸的,效果大打折扣。

所以做了Multi-Agent协作架构。核心设计是"理解 + 任务制定 + 分工 + 协作":

  • 专业化Agent:文档理解Agent专门做文档解析,用例生成Agent专门做Case设计,知识检索Agent专门做召回。这样就可以保证每个Agent职责单一,能力聚焦

  • 调度层:上层有一个统一的masterAgent负责理解用户意图,把任务分发给合适的Agent,再把结果整合起来

  • 灵活编排:支持串行、并行、条件分支等多种编排模式,根据场景选择合适的执行策略

  • 可观测性:完整的执行链路追踪,每个Agent的输入输出都能看到,调试和优化有据可依

这套架构跑起来之后,复杂任务的完成质量明显提升,而且每个环节都可以单独调优,不会牵一发动全身。

一个体会:Multi-Agent的核心是"让对的Agent在对的节点做对的事"。

同样贴两张图,互相学习(不会放太多,只做简单说明哈):

单Agent与Multi-Agent架构对比

端到端测试工作流

最后上下文工程

今年有个很火的观点:"Prompt Engineering已死,Context Engineering当立"。

技术有时候革新的太快,还沉浸在prompt,知识库等AI领域知识学习的状态中,已经有新东西出来了。为了不掉队,保持学习的低姿态。

看完之后,只有一个感受:有东西!用大模型用得越多,越发现:模型能力是基础,但输出什么样的质量很大程度上取决于:你告诉它什么上下文。

当然,现在上下文也还在初步的尝试,学习使用阶段。目前在上下文工程上做了几件事:

  • 上下文压缩:召回内容太多会超token限制,需要智能裁剪:保留最相关的、去掉冗余的、控制在合理长度内

  • 上下文增强:不只是塞检索结果,还要补充必要的背景信息、格式要求、few-shot示例,让模型更容易理解任务

  • 对话上下文管理:多轮对话中,哪些历史要保留、哪些可以丢弃、怎么做摘要。这是很重要的,因为直接影响对话的连贯性和准确性

目前的一些尝试,浅显体会是:上下文工程的价值可能是当前LLM应用中被低估了的一部分。个人感受:与其花大力气选模型、调Prompt。不如学习如何使用上下文。

思考&体会

做了差不多大半年AI方向,有一些个人的感受:

第一,工程能力很重要。怎么理解呢?

  • 刚开始接触大模型的时候,总觉得模型能力是最重要的------选对模型,问题就解决一大半。后来实践久了发现,选模型只是很小的一部分。怎么组织知识、怎么设计上下文、怎么让多个Agent配合起来......这些才是真正决定效果的核心!!!有时候换个更强的模型,可能效果是提升了;但把上下文设计优化一下,效果能提升更多。所以工程能力设计才是核心竞争力。

第二,用户不在乎你的技术多牛,只在乎好不好用。

  • 比方说召回率再怎么提升,对于用户而言,并不那么重要。用户根本感知不到这个差异。反倒是把loading时间从5秒压到2秒、把结果从"等半天一次性出来"改成"一边生成一边显示"------用户立刻就觉得"哇,这个可以,牛x"。技术指标是给自己看的,用户体验才是给用户的。从做一个优秀的产品视角做好智能化。

第三,别太焦虑,选准方向踏实做。

  • 今年AI圈新概念满天飞,每周都有新论文、新框架、新名词。一开始我也是焦虑的,哇,这么多学不过来怎么办...后来慢慢想通了:技术是为场景服务的,不是为了追热点。与其浅尝辄止地追每一个新东西,不如找准几个核心能力,在自己的场景里扎下去,踏踏实实的做,做深做透。反而心里更有底。

最后 "AI真的能提效吗?"

我的答案是:能,但不是你想象的那种"一键生成"。它更像是一个"助手"。能帮你做很多重复性、模式化的工作,但核心的思考、判断、决策,自己决定。

与其焦虑。不如先行 共勉~

愿景

最后聊聊对新一年的期待,共同学习。

技术方向上,我会关注的几个点:

  1. 知识库:向量检索只是知识库的冰山一角。更完整的知识库应该包括:知识的组织、更新、版本管理、权限控制,以及知识与Agent的深度融合。这块还有很大的能力需要建设。

  2. 多智能体协作:Agent能根据任务动态组织、能相互学习、能处理冲突。

  3. 上下文工程:这个词是最近在圈子里很火的概念。核心观点是:对于LLM应用来说,"如何构造输入给模型的上下文"可能比"选择什么模型"更重要。我很认同。

  4. Skills技能:让Agent拥有可复用、可组合的"技能"。每次都从头学习,是很笨的。这是Agent能力提升的关键之一。

写在最后

2025年是充实的一年。

技术上,在AI方向有了很多的尝试,落地。学到了很多领域的知识。这是一件很棒的事。我很喜欢。

生活上,我有了家庭和女儿。我是女儿奴,我承认。

2026年,希望能继续保持这个节奏:认真工作,好好生活,捡起写文章的好习惯。

最后的最后,如果你也在做AI方向的工作,欢迎交流。在技术的路上,一起前行~

元旦快乐!

相关推荐
文心快码BaiduComate18 小时前
百度云与光本位签署战略合作:用AI Agent 重构芯片研发流程
前端·人工智能·架构
风象南19 小时前
Claude Code这个隐藏技能,让我告别PPT焦虑
人工智能·后端
KaneLogger19 小时前
【翻译】打造 Agent Skills 的最佳实践
agent·ai编程·claude
QCY19 小时前
「完全理解」1 分钟实现自己的 Coding Agent
前端·agent·claude
Mintopia19 小时前
OpenClaw 对软件行业产生的影响
人工智能
mCell20 小时前
从零构建一个 Mini Claude Code:面向初学者的 Agent 开发实战指南
typescript·agent·claude
雮尘20 小时前
如何在非 Claude IDE (TARE、 Cursor、Antigravity 等)下使用 Agent Skills
前端·agent·ai编程
陈广亮20 小时前
构建具有长期记忆的 AI Agent:从设计模式到生产实践
人工智能
会写代码的柯基犬20 小时前
DeepSeek vs Kimi vs Qwen —— AI 生成俄罗斯方块代码效果横评
人工智能·llm
Mintopia21 小时前
OpenClaw 是什么?为什么节后热度如此之高?
人工智能