上个月,我看到一名初级分析师的晋升超过了一名资深数据科学家。
不是因为她更懂Python,也不是因为她有更光鲜的学位。她得到晋升是因为她能在两分钟内解释清楚机器学习模型对销售团队的实际意义。那位数据科学家呢?他花了40分钟谈论梯度下降,结果头五分钟就把听众讲懵了。
按回车键或点击以查看全尺寸图像

照片由安妮·斯普拉特在Unsplash上拍摄
那一刻让我多年来一直注意到的事情变得清晰起来。每个人都在争先恐后地在简历中加上 "AI",但真正赚钱的人并不是那些追逐每一个新框架的人。而是那些弄清楚企业真正需求的人。
企业目前需要的不是更多的AI,而是能够让AI发挥作用的人。
2025年的AI淘金热(以及为何大多数人都在错误的地方挖掘)
让我给你讲讲Dev。聪明的孩子,刚毕业,花了六个月时间构建用于图像识别的神经网络。作品集令人印象深刻。能跟你滔滔不绝地讲变压器架构和注意力机制。
他申请了47份工作,获得3次面试机会,零份录用通知。
与此同时,他的室友普里亚选择了不同的道路。她学习了 SQL,掌握了一些基础 Python 知识,并且非常擅长就数据提出恰当的问题。她在一家中型金融科技公司获得了商业智能分析师的职位。起薪是多少?78000 美元。六个月后呢?在证明自己能够将杂乱的数据转化为为公司节省真金白银的决策后,薪资涨到了 92000 美元。
差别在哪里?Dev试图在一个工具每三个月就更新一次的领域成为专家,而Priya则通过解决实际问题变得不可或缺。
当你初出茅庐时,没人会告诉你这些。最炫酷的技能往往并非最有价值的技能。当下,人人都想成为构建AI的那个人。几乎没人愿意成为确保AI真正为企业发挥作用的那个人。而这个差距?这就是财富隐藏的地方。
根据2024年高德纳(Gartner)的一份报告,85%的AI项目未能实现其承诺的价值。不是因为模型不好,而是因为没有人费心将它们与实际业务成果联系起来。企业被"AI驱动"的解决方案淹没,却没人知道如何使用、衡量或信任这些方案。
这创造了一个引人入胜的机会。当大家都在争论谁更了解TensorFlow时,有三个特定的角色已悄然成为房间里最有价值的人。而薪资数据以一种会让如今刚开始职业生涯的大多数人感到惊讶的方式证实了这一点。
角色 #1:分析工程师(让数据真正可用的人)
分析工程师没有得到足够的关注,说实话,这对他们有利。当数据科学家们在领英上忙着谈论他们最近参加的Kaggle竞赛时,分析工程师们却在确保数据真正流向需要的地方。
我见过分析工程师在二线城市的薪资为11万至16万美元,在主要科技中心城市为14万至19万美元。这与资深数据科学家的薪资相当,但热度和竞争程度要低得多。
这就是他们为何能成功的原因。过去两年匆忙投身AI的每一家公司如今都面临着一个巨大的问题。他们的数据一团糟。数据表之间无法相互关联。没人知道"收入"的哪个版本才是正确的。营销团队对它的叫法与财务团队不同,而数据仓库里有七种不同的定义。
这就轮到分析工程师登场了。他们构建起让数据值得信赖的基础设施。他们创建模型和转换方法,将原始数据转化为分析师真正能用得上的东西。他们是构建数据管道的人和需要依据数据做决策的人之间的桥梁。
如果你深入理解 SQL(不仅仅是基本查询,还包括窗口函数、公共表表达式、优化和性能调优),那么你已经完成了 60%。另外 40% 呢?学习像 DBT 这样的工具,理解数据建模原则,并掌握足够的 Python 来实现自动化操作。
最棒的是什么?你不需要有博士学位。你不需要懂高等微积分。你需要真正擅长思考数据应如何构建和转换。你需要关心数据质量、文档记录等事情,以及让下游分析师的工作更轻松。
**想掌握分析工程师每天都依赖的 SQL 基础知识吗?**从重要的基础开始。《数据分析师的前 50 道 SQL 面试问题》将为你提供区分普通分析师和获得晋升的分析师的精确模式和技巧。
我认识一个人,他在大约14个月内从Excel分析师成功转型为分析工程师。她痴迷于钻研SQL,学习了DBT,并开始像工作全靠它一样记录自己构建的所有东西(因为确实如此)。现在她的年薪达到13.5万美元,各公司都在积极招募她,因为优秀的分析工程师真的很难找。
需求只会不断上升。随着越来越多的公司意识到由于糟糕的数据基础,他们的AI投资正在失败,他们正疯狂地招聘分析工程师。但他们寻找的是既懂技术又懂业务的人。你需要知道何时对表进行非规范化处理,何时这样做是个糟糕的主意。你需要理解为什么数据质量很重要,以及如何实际衡量它。
角色2:机器学习运维工程师(让AI在生产环境中真正发挥作用的人)
这个职位在五年前其实并不存在。如今,它已成为科技领域最热门的职位之一,薪资水平也反映了这一点。MLOps工程师的年薪在12万至17.5万美元之间,具体取决于工作地点和工作经验。大型科技公司的高级MLOps工程师呢?年薪在18万至24万美元之间,有时甚至更高。
关于机器学习,那些华而不实的在线课程里没人告诉你的是,在Jupyter笔记本中构建模型是容易的部分。让它在生产环境中可靠运行、监测其是否发生偏移、在不破坏一切的情况下更新它,以及确保它能够扩展?这才是大多数公司完全崩溃的地方。
我见过一家公司花费40万美元构建一个推荐引擎。模型很漂亮,准确率也令人印象深刻。构建这个引擎花了八个月时间。当他们试图部署它时,生成一条推荐需要14秒。而他们的应用程序需要在200毫秒内给出结果。这个模型闲置了六个月,直到一位MLOps工程师介入,彻底重写了它的部署方式。
这就是MLOps工程师的工作。他们身处"炫酷模型"和"真正能大规模运行的东西"之间的复杂领域。他们会设置监控系统,以便你能知道模型何时开始给出奇怪的预测。他们构建能自动重新训练模型的流水线。他们确保当数据科学家更新模型时,不会破坏生产环境中的47个不同环节。
这里的技能组合很有意思,因为它是真正的混合式技能。你需要有足够的机器学习知识,才能理解数据科学家在做什么,以及他们的模型为何可能在生产环境中失败。但你也需要扎实的软件工程技能、使用云平台(AWS、GCP、Azure)的经验、容器化(Docker、Kubernetes)的经验,以及对如何构建可靠系统的深入理解。
这可不是刚从训练营出来的人就能胜任的角色。大多数MLOps工程师要么来自DevOps背景并学习ML,要么来自数据科学背景并学习生产工程。理想人选是谁呢?是那些体会过双方痛点并学会说两种"语言"的人。
目前这个角色之所以如此宝贵,原因很简单,就是稀缺。试图将ML模型投入生产的公司数量远远超过了懂得如何做好这件事的人数。而且由于这个角色很新,很多公司直到AI项目开始失败才意识到自己需要它。
如果你是一名想要提升水平的数据分析师,这是一条有趣的路径。开始学习模型部署,掌握 Docker 和基础云平台,了解 API 的工作原理,并学习足够的 Python 来实现工作流程自动化。你不需要成为机器学习专家,你需要成为让专业机器学习真正可用的人。
角色3:AI产品分析师(负责判断AI是否真的重要的人)
这是过去18个月里最让我惊讶的职位。AI产品分析师相对较新,但公司愿意为能胜任这一工作的人支付9.5万至15.5万美元的薪酬。资深的呢?14万至19万美元,尤其是在大力投资AI产品的公司。
以下是他们实际所做的事情。当一家公司开发出一项AI功能时,需要有人来确定它是否真的有帮助。不是问"模型的准确率高吗?",而是问"用户真的在使用它吗?它能提高用户留存率吗?它能推动营收增长吗?运行它的成本值得吗?"
大多数数据分析师知道如何衡量产品指标。大多数数据科学家知道如何构建模型。AI产品分析师则处于两者之间,将这两个领域联系起来。他们设计实验来测试AI功能。他们构建的仪表盘不仅展示模型性能,还展示业务影响。他们帮助产品经理理解"83%的准确率"对用户体验究竟意味着什么。
我认识一个人,她从传统产品分析领域实现了转型。她在一家SaaS公司工作时,公司开始添加AI功能。数据科学团队会推出功能,并根据模型指标宣告成功。产品团队却不知道这些功能是否真的对用户有帮助,还是只是增加了复杂性。
她开始缩小这一差距。她会参加ML团队会议,并将他们正在开发的内容转化为可测试的假设。她会设计A/B测试,不仅衡量AI是否有效,还衡量它是否让产品变得更好。不到一年,她就变得不可或缺。现在,她的年薪达到14.5万美元,每周都会拒绝招聘人员的消息。
这个岗位的美妙之处在于,你不需要深厚的ML专业知识。你只需有足够的理解能力,能够提出明智的问题。你需要具备强大的分析能力(SQL、Python、统计学)。你需要知道如何设计实验并严谨地衡量事物。而且你需要能够向非技术人员清晰地阐述复杂的权衡取舍。
**这就是像ChatGPT这样的工具成为力量倍增器的地方****。**合适的提示可以帮助你更快地分析实验结果,起草更好的假设,并更清晰地传达研究结果。严肃的分析师正在使用AI来增强自己的技能,而不是取代它们。
这个角色的价值在于视角。企业迫切想知道他们在AI上的投资是否有回报。他们需要有人能审视一个新奇的新模型,并提出令人不安的问题。它真的能解决用户问题吗?运行成本是多少?如果它出错了会怎样?用户甚至注意到它了吗?
Z世代分析师在这方面有一个独特的优势。你们是伴随着AI产品长大的。你们本能地知道AI何时有用,何时又像恼人的自动化程序。这种用户直觉,再加上扎实的分析能力,让你们在各方面都极具竞争力。
为何这三个角色正处于优势地位(以及这对你的职业意味着什么)
注意到规律了吗?这些角色都不是关于构建最华丽的模型或掌握最前沿的技术。它们都围绕着让AI在现实世界中真正发挥作用。
分析工程师确保数据值得信赖。MLOps工程师确保模型可靠运行。AI产品分析师确保整个项目对业务真正有意义。
企业终于明白,AI炒作并不能解决实际问题。真正能解决问题的是实用的AI、可扩展的AI以及能解决实际问题的AI。那些能够实现这些的人,突然比那些仅仅对神经网络了解很多的人更有价值。
我从事分析工作的时间够长了,足以见证这些周期的重复。还记得曾经人人都得成为"数据科学家",都得懂深度学习吗?结果大部分这类工作不过是美化版的Excel操作。接着人人又都得懂Spark和大数据?实际上大多数公司根本就不需要。
目前,每个人都认为自己需要了解大语言模型(LLMs)和生成式AI。有些人确实需要。但更多的人需要知道如何确保数据可靠、部署有效的模型,以及衡量AI功能是否真正有用。
薪资竞争中获胜的并非是技术能力最强的人,而是那些能够将技术能力与商业价值联系起来的人。目前,这三个角色就是最好的例证。
学习这些技能的复杂真相
如果你选择其中一条职业道路,你的职业生涯实际上会是这样的。它不会一帆风顺。你不会在18个月内从"初级分析师"直线晋升到"高级XX"。
你会花上几个月的时间,觉得自己很笨,因为周围的每个人似乎都懂你不懂的东西。你构建的东西会以尴尬的方式失败。你提交的分析结果会被证明完全错误,因为你误解了数据的收集方式。
我仍记得有一次向高管们做分析汇报,当时我自信满满地说营收下降了23%。结果发现我错误地合并了两个表格,还重复计算了退货。实际上营收增长了8%。那次会议简直是煎熬。但在那一刻,我对数据验证的了解比六个月的课程学习还要多。
通往这些高薪岗位的道路布满了错误。你会写出本应在2秒内运行完毕却需要20分钟才能运行的SQL查询。你会部署一个在测试中表现出色但在生产环境中却完全失败的模型。你会设计一个看似绝妙的实验,直到有人指出你遗漏的明显混淆变量。
这很正常。这就是每个人学习的方式。成功的人和放弃的人之间的区别不在于天赋。而在于你是否能忍受未知的不适,寻求帮助,并在事情失败时仍坚持继续努力。
**当你陷入困境时,拥有合适的工具至关重要****。**无论是掌握 SQL 模式、学会有效地向 AI 提问,还是在 Power BI 中构建更好的仪表盘,苦苦挣扎数周与在数天内取得突破之间的差别,往往就在于能否在正确的时间拥有正确的资源。
从小处着手。选择这三条路径中的一条,深入钻研基础知识。如果你对分析工程感兴趣,那就花三个月时间真正掌握 SQL。不是那种"我会写 SELECT 语句"的水平,而是"我能把一个运行 10 分钟的查询优化到 30 秒"的水平。学习索引、执行计划,以及为什么子查询会影响性能。
如果MLOps吸引你,那就深入学习一个云平台。不要试图同时学习AWS、GCP和Azure。选择一个,在上面构建实际项目,部署应用,遇到问题,解决问题。通过将一个简单的应用容器化并处理所有出现的烦人错误来学习Docker。
如果AI产品分析让你感兴趣,那就痴迷于实验设计。阅读关于A/B测试的论文。理解统计功效及其重要性。学会识别糟糕的实验,并阐明它们为何糟糕。
在这些岗位上收入超过15万美元的人,不一定比你聪明。他们只是花了数年时间去创造、去破坏,然后从残骸中学习。他们问愚蠢的问题,直到问题变得有水平。他们交付失败的项目,直到开始交付成功的项目。
无人谈及的残酷现实
你知道大多数职业建议错在哪里吗?它假定你会遵循一条逻辑路径。学习技能A,获得工作B,晋升到职位C。而实际的职业发展远比这复杂得多。
你可能在做了两年数据分析师后,才发现自己讨厌仪表盘,而热爱管道工程。你可能原本想成为一名AI产品分析师,结果却发现自己实际上更擅长MLOps。你可能钻研了一年SQL,然后因为发现了新的兴趣而转向完全不同的领域。
这很好。这很正常。你所学的每一项技能都会积累,即使最终你使用它的方式与预期不同。
我一开始想成为一名数据科学家。花了一年时间学习机器学习,构建模型,做了所有相关的事情。后来我找到了一份工作,才意识到自己对基础设施方面更感兴趣。为什么数据管道会出故障?我们怎样才能让它更可靠?为什么没人明白这个仪表盘实际测量的是什么?
这种好奇心引领我走上了一条与预期截然不同的道路。而我花在学习机器学习上的每一小时,都没有白费。这让我在基础设施工作方面表现得更好,因为我理解数据科学家的需求以及背后的原因。
你的道路也会同样奇特。接受它。目标不是选择完美的角色并执行无懈可击的五年计划。目标是培养能不断积累的技能,对实际问题保持好奇心,并持续朝着真正让你感兴趣的工作迈进。
当前这意味着什么
如果你现在是一名数据分析师,看到所有关于AI的炒作,感觉自己落后了,那就先深呼吸一下。你可能并没有落后。你只是看的指标不对。
获得晋升和高薪的人不一定是那些学习最新AI框架的人。他们是解决实际问题的人。他们明白企业并不抽象地关心模型准确性。他们关心的是收入、留存率、成本和客户满意度。
从那里开始。贵公司实际存在哪些问题?数据在哪些地方出现故障?人们开发了哪些无人使用的AI功能?利益相关者提出了哪些您无法回答的问题?
这些差距就是你的机会。每次你发现事情出现问题的地方,那就是创造有价值事物的机会。而创造有价值的事物正是你变得有价值的途径。
薪资竞争实际上并非真正关乎AI技能。它关乎成为那种能够掌握强大工具并使其发挥作用的人。有时这意味着构建更好的数据基础设施。有时这意味着可靠地部署模型。有时这意味着衡量这一切是否真的重要。
但这始终意味着解决实际问题,而不是追逐光鲜亮丽的新框架。
下面是我真正的建议,抛开所有常见的职业话题。别再担心自己是否了解最新的AI技术。开始担心自己是否能解决企业愿意付费的问题。深入学习基础知识。构建会出问题的东西。修复它们。构建更多的东西。问那些让你听起来很傻的问题,直到它们开始让你听起来很聪明。
请记住,目前在数据领域收入六位数的人,并非那些拥有最华丽技能的人。而是那些懂得如何把复杂的事情简单化、把不可靠的事情变得可靠,以及把昂贵的事情变得有价值的人。
这就是游戏。其他一切都只是噪音。