2025-个人总结 - 技术栈

一晃眼，在宇宙厂已经待了快五年了，25年基本都是在做大模型相关的工作，一边实践一边摸索，今天把这一年关于大模型的思考和感悟整理出来，跟大家好好聊一聊、分享一下。

一、聊聊Prompt：没有最好的模板，只有最适配的场景

大众接触大模型，大多是通过"对话聊天"的方式------有问题就直接问，这就是大家常说的Prompt。回想2023、2024年，那时候大模型能力还比较有限，不同模型对Prompt的格式、模板特别敏感，有时候换个模板，输出的结果就能差很远。

到了2025年，大模型能力明显提升，对模板的敏感度也降了很多。但这并不代表模板没用了，一份逻辑清楚、条理分明的Prompt，还是能帮我们更快拿到高质量的回答。这里我想跟大家澄清一个误区：根本不存在所谓的"最优Prompt模板"，要是有人说他有，那大概率是在忽悠你。

真正好用的Prompt模板，一定是跟具体场景绑在一起的。比如写复杂报告的时候，用分层式Prompt，一步步拆解需求就很顺手；处理多模块任务时，用章节格式的Prompt，逻辑会更清晰。对我来说，更实用的做法是把不同场景下好用的模板总结下来，慢慢搭一个属于自己的Prompt库，用到的时候直接调就行。

另外，现在市面上也冒出来不少AutoPrompt工具，能自动生成模板。这种工具在批量生成数据、模型训练、优化高指标模型这些场景里确实很有用，但从个人成长的角度，我更建议大家自己动手搭不同场景的模板。毕竟这个过程能让你更清楚自己的需求，搭出来的模板也更贴合自己的工作习惯。

二、大模型的2025：从"求大"到"求精"，落地才是王道

2025年，大模型不管是单模态还是多模态能力，都有了突破性的提升，但要说离真正的通用人工智能（AGI），还有不小的距离。这一年行业里最明显的变化就是，大模型不再一味追求参数规模了，转而开始"小而精"的路线，对应的SFT、RL这些优化方法也越来越多。

核心原因其实是成本控制和落地需求。之前的大模型用起来太贵了，对硬件资源的要求也高得离谱，要是一直追求"大"，最后只会变成少数巨头的游戏，大多数行业和企业都扛不住这个落地成本。这也让"All in one"的训练思路出现了分歧：有的公司还在坚持做一个能覆盖全行业的"超级大脑"，有的则选择深耕细分领域，做多个小而精的模型，再用任务调度系统让它们协同工作。这两种路径没有绝对的好坏，但后者明显能更快适配具体场景、抢占市场，属于小步快跑蚕食市场的策略。

2025年也是基于大模型的App井喷的一年。虽然很多App因为门槛低、容易被抄袭，火了一阵就没声了，但也有不少优质App活了下来。这些活下来的App都有个共同点：精准抓住了某个用户痛点，然后反复打磨产品、深耕行业研究，最后建立起了自己的壁垒。这也让我有个很深的感悟：大模型普及之后，代码层面的壁垒基本被打破了，行业知识和场景理解能力反而变得更重要了。现在"一个人公司"真的不是空想了，只要你既懂行业内核，又会用大模型，完全能靠自己搭建起轻量化的创业模式。

我这一年也用了不少国内外的一线大模型。客观说，国内大模型的使用体感还是比国外的略差一点，但跟2023、2024年比，这个差距已经小了很多。还有个行业观点我特别认同：现在的大模型不是真的有"智能"，只是靠海量的知识储备显得很智能。比如对普通人来说，大模型的回答可能会让你觉得"哇，好厉害"；但在行业专家眼里，可能就会觉得"嗯，不够深入，没什么新意"。以RL为代表的方法虽然能缓解这个问题，但没法彻底解决。不过有一点很有意思，大模型偶尔会冒出一些"奇思妙想"，总能给我的工作带来新灵感。

最后还有个行业难题没解决：新的知识不断出现，怎么把这些知识高效融入现有模型？要是新旧知识冲突了该怎么处理？这些问题不仅影响模型迭代的效率，还关系到大模型能不能适配动态变化的场景，值得我们持续关注。

三、Zeroshot：资源有限时，挖深现有大模型潜力更重要

对大多数企业来说，要么资源不够，要么行业知识太专业，通用大模型根本解决不了实际问题。所以2025年行业里另一个研究重点就是，基于现成的大模型API，怎么把它的潜力充分挖出来，比如RAG（检索增强生成）、ICL（上下文学习）这些技术，大家都在广泛探讨。

不过这些技术的落地流程比较复杂，目前行业里还没形成统一的高效应用标准。但我的建议是，对传统企业来说，与其盲目跟风自研大模型，不如专注挖深现有大模型的潜力。这样既能降低研发成本，又能快速适配业务需求，实现AI技术的轻量化落地。

四、Agent爆发年：机遇不少，但挑战也不小

2025年绝对是Agent的爆发年，行业里大家对Agent的效果和应用价值，终于有了更清晰的认识，而且它在各种业务流程里也能快速落地了。现在Agent主要还是靠人工搭建，好处是能快速让大模型适配当前场景，尽快验证需求；但缺点也很明显------要是Agent多到成千上百个，怎么管理、怎么快速检测和迭代，就成了大难题。

另一个方向是AutoAgent（自动Agent），但就我实际体验下来，它处理复杂任务的效果还不太好，而且特别费Token，对模型能力和MCP服务的要求也高。不过Agent的未来还是很值得期待的，它最大的价值就是能慢慢替代那些重复性工作，把我们从繁琐的琐事里解放出来。

这里我想强调一下，Agent不是简单搭个工作流就行了，它是一套复杂的工程体系。要是把Agent的终极目标比作造汽车、造飞船，那我们现在顶多算是造出了自行车。Agent要发挥作用，需要很多基础能力支撑，2025年行业里出了不少Agent相关的综述文章，推荐大家去看看。其中我个人觉得"记忆（Memory）管理"特别重要------它直接影响模型上下文的连贯性、任务执行的稳定性，甚至决定了大模型能不能真正实现定制化，大家可以重点关注一下。

五、AI带来的变革：悄悄发生，需要主动拥抱

就我个人感受来说，我们公司里虽然很多人都在用AI，但不少人其实没真正感受到AI带来的质的飞跃，大多只是把它当成解决简单问题的助手。在我看来，要想让AI带来真正的质的飞跃，得突破两个核心关键点：

第一是信息的全面整合 。模型要做出精准的决策，前提是能获取并整合我们日常的所有信息------这就意味着未来对存储的需求会呈百倍增长，规模难以想象。但现在的问题是，我们的信息太分散了，有的在Office，有的在WPS，还有的在笔记本里，根本没法形成完整的信息闭环。所以我觉得，未来哪个企业能把所有工具整合起来，实现信息串联，就能建立起很强的壁垒。

第二是个人专业能力的提升。要是你自己能力不够，连模型输出的结果对不对都判断不出来，只能一个个节点去检查，根本没法站在全局视角把控关键环节。这也说明，AI时代对个人专业能力的要求不仅没降低，反而更高了。

其实AI带来的变革已经在悄悄改变我们的业务流程了。现在阶段，AI还只是替换一些业务节点；但再过一段时间，可能我们还没反应过来，它就已经完成了整个业务链路的改造。这种变革往往会"伪装"成我们熟悉的样子，等我们醒悟过来，行业早就完成升级了。所以我们得时刻反思，主动去拥抱这种变化。

说到底，AI变革的基础是人的意识变革、数据变革和习惯变革的同步推进。对每个行业来说，AI既降低了入门门槛，也提高了行业天花板------它让更多人有机会达到同等的基础水平，而能不能更进一步，关键就看你怎么跟AI高效交互了。我的建议是，把AI当成亦师亦友的伙伴，当成陪伴自己成长的书童，好好利用它的价值。

写在最后

2025年，大模型行业迭代得飞快，对我个人来说，也是扎在这个领域实践、沉淀思考的一年。这一年的探索让我深刻感受到，大模型的发展已经从之前的"技术狂欢"慢慢走向"理性落地"，真正有价值的技术，最终还是要跟行业需求深度绑定才行。