AI 大模型职业选择

AI 大模型这么火,我能参与其中么?又该怎么参与呢?

如果你也有同样的困惑,不妨让我们一起静下心来,慢慢理清思路,找到属于自己的方向。

AI 大模型职业方向

AI 大模型从训练到推理的路径,

txt 复制代码
AI 算法 -> AI Infra(基础设施) -> AI 编译器 -> AI 芯片

这也就有了四个方向。

  • AI 算法:本质是实验科学。门槛在于顶会论文、数学功底和试错成本。岗位供需严重失衡,是典型的红海。
  • AI 芯片:本质是硬件工程。门槛在于架构设计、Verilog/VHDL 和流片经验,掌握在少数巨头手中,学历门槛极高。
  • AI Infra 与编译器:本质是系统工程。它拼的是工程能力、对性能的极致追求和全局视野,这是靠时间与经验积累起来的壁垒。

AI 算法和芯片是"造梦者"和"筑梦者",而 AI Infra 与编译器则是"送梦者"。大模型的落地,最终要靠系统工程让模型变得稳定、高效、便宜。这条路门槛也不低,但胜在积累,走得踏实。

四个方向,四种人生

这四个方向,供需关系目前存在结构性失衡。

AI 算法人才(供过于求的"红海")

  • 现状:入门的技术门槛看似不高(掌握 NumPy, PyTorch 即可上手),但这导致了大量人才的涌入,使得初级岗位的竞争异常激烈。
  • 紧俏度:结构性过剩。顶尖的、能发顶会论文、能设计全新架构的算法专家依然稀缺,但普通的、只会调参和套用模型的算法工程师,市场供应已经非常充足,甚至过剩。

AI 芯片人才(高精尖的"深潭")

  • 现状:门槛最高,需要深厚的硬件知识(计算机体系结构、数字电路、Verilog/VHDL),且集中在少数头部公司(如 NVIDIA、AMD、华为昇腾、地平线等)。岗位数量相对有限,且对学历和背景要求极高。
  • 紧俏度:高精尖稀缺。他们是"硬核"稀缺,但因为培养难度极大、岗位总量少,普通开发者很难进入。

AI Infra 与编译器人才(极度紧缺的"蓝海")

  • 现状:需求井喷,但供给严重不足。一个能熟练使用 CUDA 进行性能优化、或者能为 PyTorch 提交高质量代码的工程师,是所有 AI 公司都争抢的对象。很多公司甚至开出了比同级别算法工程师更高的薪水来招募 Infra 人才。
  • 紧俏度:极度紧缺。在这个领域,不需要和成千上万的应届生竞争同一个岗位。只是在和少数同样具备系统工程思维的开发者竞争,而市场上的坑位远比合格的人才多。

总结,

方向 核心工作 适合人群 竞争格局 地域分布
AI 算法 模型设计、调参、论文复现 数学功底强、顶会选手 ❌ 红海内卷 一线城市集中
AI 芯片 硬件架构、Verilog设计 体系结构背景、名校科班 🔷 高精尖稀缺 少数头部公司
AI Infra 分布式训练、推理优化、K8s调度 后端/系统工程师、实战派 🔥 极度紧缺 需求分散,机会增多
AI 编译器 图优化、算子融合、MLIR/TVM 编译原理背景、底层控 🔥 极度紧缺 可远程,社区驱动

AI Infra 和编译器的人才紧俏,本质上是因为:

  • 它们是决定大模型能否落地的关键。
    • 没有好的Infra,再牛的模型也只能躺在实验室里;没有好的编译器,算法就无法在各类芯片上高效运行。
  • 它们是目前大模型成本问题的核心解。
    • 在追求模型效果的时代,算法最重要;但在追求规模化应用和盈利的时代,成本和效率最重要,而这就是 Infra 和编译器的战场。

如果说 AI 算法和芯片是"塔尖"和"塔基",那 AI Infra 和编译器就是连接两者的"塔身",而这个"塔身"目前正处于严重的"用工荒"状态。

认识自己,找准方向

以我举例:普通学历、普通开发,不过有十几年经验,都不清楚算好算坏。

对我来说:AI Infra 和编译器就是我这样的普通开发者进入 AI 大模型行业的"黄金入口"。

如何入行?

  • 打好地基:深入理解系统(内存、网络、IO)
  • 抓住一个点突破:分布式训练、Triton + RISC-V 等
  • 工具链加持:学会用 Profiler(Nsight、Perf)说话
  • 社区入场券:从提 PR 开始,让代码为我代言

二线城市!

  • 本地机会挖掘:超算中心/半导体/IoT,或等发展
  • 工作能力建设:开源贡献+技术博客+精准连接
  • 小成本实验法:云上几百元买来的分布式训练学习

如果你和我情况不同,无论职业方向还是学习路径,都可以咨询 AI 了。

结语:AI 的下半场

AI 大模型的上半场是算法的狂欢,下半场拼的是工程落地。与其在红海里卷算法,不如在蓝海里建壁垒。

相关推荐
小七-七牛开发者2 小时前
Coding Agent 规则管理:CLAUDE.md、Skills、Hooks、Subagents 到底怎么选?
ai·大模型·agent·claude·token·loop·mcp·claudecode·ai coding
doiito8 小时前
左脚踩右脚:让 LLM 自进化的 Agent 轨迹训练法——为什么它能补上主流范式的最后一块拼图
ai·系统设计
带刺的坐椅17 小时前
从 Claude Code 隐私争议,看 SolonCode 的设计选择
ai·llm·agent·claudecode·soloncode·codingplan
lincats1 天前
Claude Code项目越写越乱?这套清理流程能救你
ai·ai agent·claude code
云燕实验室CloudLab1 天前
《AI开始"抱团"思考了!多智能体 + 思维图到底有多强?》
ai·学习工具·智慧学伴
小七-七牛开发者1 天前
论文解读:DeepSeek DSpark 在真实高并发推理服务中,如何保证 Token 生成又好又快?
ai·大模型·编程·ai coding
doiito1 天前
【Agent Harness】Gliding Horse 核心设计理念,不跟风开发自己的AI Agent
ai·rust·架构设计·系统设计·ai agent
doiito2 天前
【Agent Harness】Gliding Horse 的 L2 作战地图:让多 Agent 协作从“摸黑”变成“透明”
ai·rust·架构设计·系统设计·ai agent
xiezhr2 天前
逛GitHub发现一款免费带有AI功能的数据库管理工具DBX
ai·开源软件·自然语言·数据库管理工具
垚森4 天前
我用 GLM-5.2 造了个炸裂主题后台:16 套主题随心切,可在线体验
ai·react