2025年终总结:AI浪潮下的一年

阔别三年,久违了

Hi,大家好呀。已经很久没在掘金上写文章了,上次发文章,也是三年前的事了。这三年也不是没想过写点什么,但每次打开编辑器,敲几行字又删了...

可能"也许没什么好记录的吧"。哈哈~

今年有些不一样:这一年做的事情,可能是我这几年工作以来比较有"沉淀和进步"的一年。AI的浪潮真正席卷到了我们日常工作的每一个角落。从年初的观望,到年中的All in,再到现在真正落地了一些能力。

所以,25年的最后一天是值得记录下来,给这一年画个完美句号。

当然哈,除了技术方向上的一些唠叨,也开心的聊聊这一年的生活、还有一些零碎的感悟。

如果可以,听首歌,慢慢看。

生活:最大的变化,是角色的转换

在消失的三年中,我成了家。有了一个可爱的女儿"柚柚"。

说实话,当爸爸这件事,比写任何代码都难。代码不行可以重写,bug可以debug,但小朋友的每一个哭声、每一次发烧,我都很局促...

女儿刚出生的那几个月,我经历了人生中最混乱的时期。白天在公司开会、写代码、处理线上问题;晚上回家换尿布、冲奶粉、哄睡觉。有一次凌晨2、3点,女儿发高烧,第一次面临这个问题手忙脚乱,夜里开车带着小孩去医院急诊。那种揪心,着急,相信每个新手爸妈都会和我一样,不知所措。

也分享一些没体验过的时刻:

  • 她第一次对着我笑,嘴角弯弯的,眼睛亮亮的;
  • 她会用小手抓住我的手指,攥得紧紧的不肯放;
  • 她会"啊啊"地跟我"对话",虽然听不懂,但我每次都认真回应。有时候加班回家晚了,她已经睡着了。我就在床边坐一会儿,看着她的小脸,觉得一天的疲惫都消散了,很开心。

成家、当爸爸,这些事情让我更加有动力给她们更好的生活。这对我来说弥足珍贵

技术:核心三件事

今年工作上最大的感受:AI从"能用"到"好用",要走的路很长,做的事很多。

年初那会儿,大模型已经火了快一年,各种Agent框架、RAG方案遍地开花,再加上DeepSeek横空出世带来的冲击,感觉AI的门槛一下子被拉低了:好像谁都能花三天时间搭一个"智能助手"出来。

但真正想把AI落到实际业务里时,会发现:跑通一个demo和做出一个能用的产品,完全是两回事。所以这一年主要做了三件事:搭知识库、建Multi-Agent架构、做上下文工程。

首先是知识库 - 让AI"懂业务"

大模型最大的问题是什么?它什么都知道一点,但对你的业务一无所知。

我涉及的场景是测试领域------需求文档、接口文档、历史测试用例、业务规则......这些知识散落在各个系统里,格式不一,质量参差不齐。直接丢给大模型,它根本理解不了。所以第一件事,是搭建一套企业级的知识库。

核心思路:"先结构化,再向量化":

  • 知识入库:把各种来源的文档统一采集,做清洗、去重、脱敏

  • 语义增强:不是简单存原文,而是提取实体、关系、关键信息,形成结构化的知识单元

  • 多维向量:不同粒度的内容用不同的向量策略------句子级捕捉语义细节,段落级理解上下文,文档级把握整体主题

  • 混合检索:向量检索 + 关键词检索 + 规则过滤,多路召回再统一排序

做完这套,AI的回答就不再是泛泛而谈的看似正确的废话了~

这里贴一些图吧:

系统架构

数据处理

紧接着就是Multi-Agent - 复杂任务规划协作

为什么会需要到 Multi-Agent呢?单个Agent能做的事是有限的。当任务变的比较复杂的时候:比如"读懂一份需求文档,提取测试点,生成测试用例,还要参考历史Case"塞进一个Agent里,prompt是很爆炸的,效果大打折扣。

所以做了Multi-Agent协作架构。核心设计是"理解 + 任务制定 + 分工 + 协作":

  • 专业化Agent:文档理解Agent专门做文档解析,用例生成Agent专门做Case设计,知识检索Agent专门做召回。这样就可以保证每个Agent职责单一,能力聚焦

  • 调度层:上层有一个统一的masterAgent负责理解用户意图,把任务分发给合适的Agent,再把结果整合起来

  • 灵活编排:支持串行、并行、条件分支等多种编排模式,根据场景选择合适的执行策略

  • 可观测性:完整的执行链路追踪,每个Agent的输入输出都能看到,调试和优化有据可依

这套架构跑起来之后,复杂任务的完成质量明显提升,而且每个环节都可以单独调优,不会牵一发动全身。

一个体会:Multi-Agent的核心是"让对的Agent在对的节点做对的事"。

同样贴两张图,互相学习(不会放太多,只做简单说明哈):

单Agent与Multi-Agent架构对比

端到端测试工作流

最后上下文工程

今年有个很火的观点:"Prompt Engineering已死,Context Engineering当立"。

技术有时候革新的太快,还沉浸在prompt,知识库等AI领域知识学习的状态中,已经有新东西出来了。为了不掉队,保持学习的低姿态。

看完之后,只有一个感受:有东西!用大模型用得越多,越发现:模型能力是基础,但输出什么样的质量很大程度上取决于:你告诉它什么上下文。

当然,现在上下文也还在初步的尝试,学习使用阶段。目前在上下文工程上做了几件事:

  • 上下文压缩:召回内容太多会超token限制,需要智能裁剪:保留最相关的、去掉冗余的、控制在合理长度内

  • 上下文增强:不只是塞检索结果,还要补充必要的背景信息、格式要求、few-shot示例,让模型更容易理解任务

  • 对话上下文管理:多轮对话中,哪些历史要保留、哪些可以丢弃、怎么做摘要。这是很重要的,因为直接影响对话的连贯性和准确性

目前的一些尝试,浅显体会是:上下文工程的价值可能是当前LLM应用中被低估了的一部分。个人感受:与其花大力气选模型、调Prompt。不如学习如何使用上下文。

思考&体会

做了差不多大半年AI方向,有一些个人的感受:

第一,工程能力很重要。怎么理解呢?

  • 刚开始接触大模型的时候,总觉得模型能力是最重要的------选对模型,问题就解决一大半。后来实践久了发现,选模型只是很小的一部分。怎么组织知识、怎么设计上下文、怎么让多个Agent配合起来......这些才是真正决定效果的核心!!!有时候换个更强的模型,可能效果是提升了;但把上下文设计优化一下,效果能提升更多。所以工程能力设计才是核心竞争力。

第二,用户不在乎你的技术多牛,只在乎好不好用。

  • 比方说召回率再怎么提升,对于用户而言,并不那么重要。用户根本感知不到这个差异。反倒是把loading时间从5秒压到2秒、把结果从"等半天一次性出来"改成"一边生成一边显示"------用户立刻就觉得"哇,这个可以,牛x"。技术指标是给自己看的,用户体验才是给用户的。从做一个优秀的产品视角做好智能化。

第三,别太焦虑,选准方向踏实做。

  • 今年AI圈新概念满天飞,每周都有新论文、新框架、新名词。一开始我也是焦虑的,哇,这么多学不过来怎么办...后来慢慢想通了:技术是为场景服务的,不是为了追热点。与其浅尝辄止地追每一个新东西,不如找准几个核心能力,在自己的场景里扎下去,踏踏实实的做,做深做透。反而心里更有底。

最后 "AI真的能提效吗?"

我的答案是:能,但不是你想象的那种"一键生成"。它更像是一个"助手"。能帮你做很多重复性、模式化的工作,但核心的思考、判断、决策,自己决定。

与其焦虑。不如先行 共勉~

愿景

最后聊聊对新一年的期待,共同学习。

技术方向上,我会关注的几个点:

  1. 知识库:向量检索只是知识库的冰山一角。更完整的知识库应该包括:知识的组织、更新、版本管理、权限控制,以及知识与Agent的深度融合。这块还有很大的能力需要建设。

  2. 多智能体协作:Agent能根据任务动态组织、能相互学习、能处理冲突。

  3. 上下文工程:这个词是最近在圈子里很火的概念。核心观点是:对于LLM应用来说,"如何构造输入给模型的上下文"可能比"选择什么模型"更重要。我很认同。

  4. Skills技能:让Agent拥有可复用、可组合的"技能"。每次都从头学习,是很笨的。这是Agent能力提升的关键之一。

写在最后

2025年是充实的一年。

技术上,在AI方向有了很多的尝试,落地。学到了很多领域的知识。这是一件很棒的事。我很喜欢。

生活上,我有了家庭和女儿。我是女儿奴,我承认。

2026年,希望能继续保持这个节奏:认真工作,好好生活,捡起写文章的好习惯。

最后的最后,如果你也在做AI方向的工作,欢迎交流。在技术的路上,一起前行~

元旦快乐!

相关推荐
数据猿2 小时前
【金猿人物展】海尔智慧家尹德帅:以数据智能重构智慧家庭生态,引领场景品牌数字化转型新范式
大数据·人工智能·重构
想要成为计算机高手2 小时前
VLA中人类数据迁移到机器人后的涌现 -- physical intelligence -- 2025.12.16
人工智能·机器人·具身智能·vla
路人与大师2 小时前
大规模多变量AutoML调参实验报告
人工智能·深度学习·机器学习
MoonBit月兔2 小时前
生态影响力持续提升,MoonBit 登 2025 中国技术品牌影响力榜单
大数据·人工智能·ai编程·moonbit
2501_945292172 小时前
AI证书的十字路口:政策变动后,国际通行证正在贬值吗?
人工智能
城市直通车3 小时前
聚焦产业落地与生态共建小拼AI携手火山引擎共推AIGC电商智能化升级
人工智能·aigc·火山引擎
傻啦嘿哟3 小时前
深度学习破解复杂验证码:CNN实战指南
人工智能·深度学习·cnn
人工智能培训3 小时前
深度学习—卷积神经网络(4)
人工智能·深度学习·神经网络·机器学习·cnn·dnn
小糖豆巴拉巴拉3 小时前
AI应用(1)-基础概念的理解
人工智能