图片来自 Unsplash 上的 Héctor J. Rivas
如果你曾觉得作为一名 ML 工程经理的一天,就是不断切换各种上下文,那你不是一个人。
上一秒你还在审查模型的 ROC 曲线,
下一秒你已经在聊招聘预算,
突然又得去搞模型扩展,
还没喘口气呢,部署计划的邮件又来了。
这玩意真让人晕。
节奏完全靠不住。
为了跟上节奏,你得戴上很多"帽子"。不是说真的戴帽子(虽然真戴了也许更好认),而是指你要不断变换角色。
来,我们看看我自己最常戴的六顶帽子,有时候甚至一下午全戴过一遍。
🎩 帽子一:心理咨询师
支持你团队的情绪和心理
ML 这个领域真的是容易让人烧脑烧到脱发。
实验 - 微调 - 改方向,这种循环能压垮任何人。尤其是当你那个精度极高的深度学习模型,结果居然不符合线上延迟要求。
我见过,团队为了多那百分之一的效果,连续训练模型几周。
结果业务方一拍脑门,说因为解释性的问题,还是选了个简单的 baseline 模型。
真扎心。
团队直接被打击到了。
甚至开始怀疑,"我们之前那一堆努力,都是白干?"
这时候,你就要戴上心理咨询师的帽子。
你不是管任务的,你是在管心态。你得提醒他们:
- "感觉沮丧是正常的。"
- "这次模型没上线,但我们还是学到了很多。"
- "你没有落后,这个领域两周一个新变化。"
在像 GenAI 这样变化贼快的领域,人们不是被工作量压垮的,而是被那种"永远跟不上"的感觉压垮的。
这都是成长的一部分,你得帮他们看到这一点。
🎩 帽子二:招聘经理
招的是"合适的人",而不是简历上的热词
ML 的招聘是真的 tricky。
简历上写满了 RAG、LLM、Diffusion Model。
但真正能把 Jupyter Notebook 搬上线跑的人,少之又少。
你真正要招的,是那种好奇心强、有韧性、有系统思维的人。
我见过最棒的候选人,根本不是 FAANG 出来的。
他们就是动手搞项目,哪怕是些毛坯项目,搞砸了自己也能修好。
别看头衔,别看 buzzword,好奇和实干才是关键。
🎩 帽子三:谈判专家
调解团队里的分歧
ML 团队内部争论是日常操作。
一个想上 deep learning,另一个说用 GBM 比较好解释,PM 啥也不懂,就想下个 sprint 项目得上线。
你不能偏哪一边。你得把话题拉回来,对齐业务目标。
有一次我们讨论:是用 RAG 框架,还是给模型做 fine-tune?
一边说 RAG 简单高效又省钱,另一边说 fine-tune 才能更贴品牌调性、生成质量高。
我就把对话拉回来了:
我们到底需要的是啥?
- 是上线快?
- 是成本低?
- 还是内容更精确?
这顶帽子一般在讨论模型设计时戴得最多,比如:
- "要不要用 GPT-4 来生成内容?"
- "不如我们自部署 Mistral,便宜!"
- "我们得试试 agent!现在都在搞 agent!"
而产品团队就一句话:你整一个能跑的就行。
这时候你就得出来说:
- "别争 API 了,先搞清楚我们要解决的问题是啥。"
- "延迟到底是不是致命问题?"
- "最简单能解决用户需求的方案是什么?"
你不是裁判,你是引导者。
你负责把技术选择和业务上下文对齐,让大家往前走,不是在原地绕圈圈。
争论可以有,但别让它变成内耗。
🎩 帽子四:技术向导
技术不过时,才能给团队指路
你不能天天写代码,但也不能脱节。
你得懂得分辨出:
- 模型的 precision 被 data drift 拉垮了
- chatbot 在胡说八道,是因为 top-k 检索质量太烂
在 AI 这个飞速变化的世界,保持技术敏感度真的不容易。
新框架一周一出,上一季度最强的模型今天可能就成"老黄历"。
但说真的,值得跟上。
你得能帮团队排雷,能在关键时候问对问题,拿对方向,说得出技术人的语言,
这样你才不仅仅是那个"开会的人"。
🎩 帽子五:翻译官
在技术和业务之间做"中转站"
你戴这顶帽子的时候,一般是和那些听不懂技术、但只关心成果的业务方开会。
比如,跟市场总监解释 RAG 和 LLM,是很难的事。
他们不在乎你用的嵌入模型是什么,语义分块怎么做的。
他们只关心这玩意能不能:
- 降低客户流失率?
- 提升用户参与度?
有一次我们搞了个医疗客服 chatbot,用的是 RAG 框架。
效果很好,但领导担心模型会瞎说,还怕带偏见。
我就解释了 RAG 是怎么设计来防止 hallucination 的,我们还能怎么在架构里加组件去处理偏见和错误。
我说:
"这个模型可以从我们内部文档中调资料来快速回应客户,文档没偏见,能帮客服节省超过 70% 的工时。"
别跟市场部讲 BLEU 分数。
你得告诉他们:
- 这个模型能帮你留住客户
- 或者,它能提前标记可能炸锅的客服工单
你的任务很简单:
把技术翻成业务语言,把业务需求翻成技术语言。
这不仅让项目对得上业务目标,也能阻止团队瞎追没意义的技术指标。
🎩 帽子六:项目经理
管时间线、管资源、管部署节奏
ML 项目从来不是直线走的。
你以为要上线了,结果发现特征管道压根跑不稳,不能做实时预测。
所以你得提前问那些"讨人嫌"的问题:
- "哪一步最容易出问题?"
- "我们有 Plan B 吗?"
- "真用过线上数据测过没?"
你把模糊的东西,拆成一步步能执行的任务。
你让团队知道目标在哪。
你防止大家陷入"我们再做一个小实验试试"的死循环。
模糊不可避免,但你得给出清晰感和方向。
🎩 加送帽子:终身学习者
因为在 GenAI 世界,唯一不变的就是变化
这一个月大家都在讲 fine-tune LLM。
下一个月就变成了 prompt 工程 + RAG 优化。
突然,Agent 火了,满世界都在做。
你眨一下眼,就发现自己又落后了。
作为 ML EM(工程经理),你得始终保持好奇心------哪怕你忙到飞起。
你得给团队一个信号:
"我们不用全都懂,但我们得一直在学。"
是的,会感觉压力山大。
但说真的,这不就是这份工作的魅力所在吗?
结语
帽子只会越来越多,切换上下文的节奏也不会停。
你甚至会有那么一刻,突然怀疑:"我真的还能胜任吗?"
这时候,
- 抬头看看全局
- 想想你对团队的影响,不止是 KPI
- 然后别害怕说出:"我也不知道,我们一起搞清楚。"
有时候,
把帽子摘下来,
走出去,
摸摸草(不管是字面还是比喻上的)。
提醒自己:你已经做得很好了。
这份工作不是要求你全知道,而是帮你的团队问出更好的问题,给他们一个安心探索的空间。
"成功不是从不迷路,而是每次都能找到回来的路。"