2025-个人总结

一晃眼,在宇宙厂已经待了快五年了,25年基本都是在做大模型相关的工作,一边实践一边摸索,今天把这一年关于大模型的思考和感悟整理出来,跟大家好好聊一聊、分享一下。

一、聊聊Prompt:没有最好的模板,只有最适配的场景

大众接触大模型,大多是通过"对话聊天"的方式------有问题就直接问,这就是大家常说的Prompt。回想2023、2024年,那时候大模型能力还比较有限,不同模型对Prompt的格式、模板特别敏感,有时候换个模板,输出的结果就能差很远。

到了2025年,大模型能力明显提升,对模板的敏感度也降了很多。但这并不代表模板没用了,一份逻辑清楚、条理分明的Prompt,还是能帮我们更快拿到高质量的回答。这里我想跟大家澄清一个误区:根本不存在所谓的"最优Prompt模板",要是有人说他有,那大概率是在忽悠你。

真正好用的Prompt模板,一定是跟具体场景绑在一起的。比如写复杂报告的时候,用分层式Prompt,一步步拆解需求就很顺手;处理多模块任务时,用章节格式的Prompt,逻辑会更清晰。对我来说,更实用的做法是把不同场景下好用的模板总结下来,慢慢搭一个属于自己的Prompt库,用到的时候直接调就行。

另外,现在市面上也冒出来不少AutoPrompt工具,能自动生成模板。这种工具在批量生成数据、模型训练、优化高指标模型这些场景里确实很有用,但从个人成长的角度,我更建议大家自己动手搭不同场景的模板。毕竟这个过程能让你更清楚自己的需求,搭出来的模板也更贴合自己的工作习惯。

二、大模型的2025:从"求大"到"求精",落地才是王道

2025年,大模型不管是单模态还是多模态能力,都有了突破性的提升,但要说离真正的通用人工智能(AGI),还有不小的距离。这一年行业里最明显的变化就是,大模型不再一味追求参数规模了,转而开始"小而精"的路线,对应的SFT、RL这些优化方法也越来越多。

核心原因其实是成本控制和落地需求。之前的大模型用起来太贵了,对硬件资源的要求也高得离谱,要是一直追求"大",最后只会变成少数巨头的游戏,大多数行业和企业都扛不住这个落地成本。这也让"All in one"的训练思路出现了分歧:有的公司还在坚持做一个能覆盖全行业的"超级大脑",有的则选择深耕细分领域,做多个小而精的模型,再用任务调度系统让它们协同工作。这两种路径没有绝对的好坏,但后者明显能更快适配具体场景、抢占市场,属于小步快跑蚕食市场的策略。

2025年也是基于大模型的App井喷的一年。虽然很多App因为门槛低、容易被抄袭,火了一阵就没声了,但也有不少优质App活了下来。这些活下来的App都有个共同点:精准抓住了某个用户痛点,然后反复打磨产品、深耕行业研究,最后建立起了自己的壁垒。这也让我有个很深的感悟:大模型普及之后,代码层面的壁垒基本被打破了,行业知识和场景理解能力反而变得更重要了。现在"一个人公司"真的不是空想了,只要你既懂行业内核,又会用大模型,完全能靠自己搭建起轻量化的创业模式。

我这一年也用了不少国内外的一线大模型。客观说,国内大模型的使用体感还是比国外的略差一点,但跟2023、2024年比,这个差距已经小了很多。还有个行业观点我特别认同:现在的大模型不是真的有"智能",只是靠海量的知识储备显得很智能。比如对普通人来说,大模型的回答可能会让你觉得"哇,好厉害";但在行业专家眼里,可能就会觉得"嗯,不够深入,没什么新意"。以RL为代表的方法虽然能缓解这个问题,但没法彻底解决。不过有一点很有意思,大模型偶尔会冒出一些"奇思妙想",总能给我的工作带来新灵感。

最后还有个行业难题没解决:新的知识不断出现,怎么把这些知识高效融入现有模型?要是新旧知识冲突了该怎么处理?这些问题不仅影响模型迭代的效率,还关系到大模型能不能适配动态变化的场景,值得我们持续关注。

三、Zeroshot:资源有限时,挖深现有大模型潜力更重要

对大多数企业来说,要么资源不够,要么行业知识太专业,通用大模型根本解决不了实际问题。所以2025年行业里另一个研究重点就是,基于现成的大模型API,怎么把它的潜力充分挖出来,比如RAG(检索增强生成)、ICL(上下文学习)这些技术,大家都在广泛探讨。

不过这些技术的落地流程比较复杂,目前行业里还没形成统一的高效应用标准。但我的建议是,对传统企业来说,与其盲目跟风自研大模型,不如专注挖深现有大模型的潜力。这样既能降低研发成本,又能快速适配业务需求,实现AI技术的轻量化落地。

四、Agent爆发年:机遇不少,但挑战也不小

2025年绝对是Agent的爆发年,行业里大家对Agent的效果和应用价值,终于有了更清晰的认识,而且它在各种业务流程里也能快速落地了。现在Agent主要还是靠人工搭建,好处是能快速让大模型适配当前场景,尽快验证需求;但缺点也很明显------要是Agent多到成千上百个,怎么管理、怎么快速检测和迭代,就成了大难题。

另一个方向是AutoAgent(自动Agent),但就我实际体验下来,它处理复杂任务的效果还不太好,而且特别费Token,对模型能力和MCP服务的要求也高。不过Agent的未来还是很值得期待的,它最大的价值就是能慢慢替代那些重复性工作,把我们从繁琐的琐事里解放出来。

这里我想强调一下,Agent不是简单搭个工作流就行了,它是一套复杂的工程体系。要是把Agent的终极目标比作造汽车、造飞船,那我们现在顶多算是造出了自行车。Agent要发挥作用,需要很多基础能力支撑,2025年行业里出了不少Agent相关的综述文章,推荐大家去看看。其中我个人觉得"记忆(Memory)管理"特别重要------它直接影响模型上下文的连贯性、任务执行的稳定性,甚至决定了大模型能不能真正实现定制化,大家可以重点关注一下。

五、AI带来的变革:悄悄发生,需要主动拥抱

就我个人感受来说,我们公司里虽然很多人都在用AI,但不少人其实没真正感受到AI带来的质的飞跃,大多只是把它当成解决简单问题的助手。在我看来,要想让AI带来真正的质的飞跃,得突破两个核心关键点:

第一是信息的全面整合 。模型要做出精准的决策,前提是能获取并整合我们日常的所有信息------这就意味着未来对存储的需求会呈百倍增长,规模难以想象。但现在的问题是,我们的信息太分散了,有的在Office,有的在WPS,还有的在笔记本里,根本没法形成完整的信息闭环。所以我觉得,未来哪个企业能把所有工具整合起来,实现信息串联,就能建立起很强的壁垒。

第二是个人专业能力的提升。要是你自己能力不够,连模型输出的结果对不对都判断不出来,只能一个个节点去检查,根本没法站在全局视角把控关键环节。这也说明,AI时代对个人专业能力的要求不仅没降低,反而更高了。

其实AI带来的变革已经在悄悄改变我们的业务流程了。现在阶段,AI还只是替换一些业务节点;但再过一段时间,可能我们还没反应过来,它就已经完成了整个业务链路的改造。这种变革往往会"伪装"成我们熟悉的样子,等我们醒悟过来,行业早就完成升级了。所以我们得时刻反思,主动去拥抱这种变化

说到底,AI变革的基础是人的意识变革、数据变革和习惯变革的同步推进。对每个行业来说,AI既降低了入门门槛,也提高了行业天花板------它让更多人有机会达到同等的基础水平,而能不能更进一步,关键就看你怎么跟AI高效交互了。我的建议是,把AI当成亦师亦友的伙伴,当成陪伴自己成长的书童,好好利用它的价值。

写在最后

2025年,大模型行业迭代得飞快,对我个人来说,也是扎在这个领域实践、沉淀思考的一年。这一年的探索让我深刻感受到,大模型的发展已经从之前的"技术狂欢"慢慢走向"理性落地",真正有价值的技术,最终还是要跟行业需求深度绑定才行。

相关推荐
Aaron15882 小时前
三种主流接收机架构(超外差、零中频、射频直采)对比及发展趋势浅析
c语言·人工智能·算法·fpga开发·架构·硬件架构·信号处理
Coder_Boy_2 小时前
基于SpringAI企业级智能教学考试平台核心模块协同总结与最佳实践方案
java·大数据·人工智能
IT_陈寒2 小时前
JavaScript性能优化:7个被低估的V8引擎技巧让你的代码提速50%
前端·人工智能·后端
数字化顾问2 小时前
(103页PPT)产业园区智能化规划设计方案(附下载方式)
大数据·人工智能
愚公搬代码2 小时前
【愚公系列】《扣子开发 AI Agent 智能体应用》029-实战案例:自动生成 PPT的智能办公助手
人工智能·powerpoint
LS_learner2 小时前
如何跟上当今AI高速发展的步伐
人工智能
不错就是对2 小时前
【Agent-lightning】 - 1_环境搭建
人工智能·pytorch·深度学习·机器学习·chatgpt·transformer·vllm
dazzle2 小时前
计算机视觉处理(OpenCV基础教学(十三):图像水印添加技术详解)
人工智能·opencv·计算机视觉
Wilson Chen2 小时前
从“手搓”到云原生:某 B2B 平台服装 AI 搜索架构演进实战
人工智能·云原生·架构