news 2026/4/15 20:33:11

收藏!AI小白/程序员必看:大模型方向选择与进阶指南,助你抢占高薪岗位

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
收藏!AI小白/程序员必看:大模型方向选择与进阶指南,助你抢占高薪岗位

本文针对AI领域新手及程序员,深入剖析大模型方向(LLM、多模态、AIGC)的选择与进阶策略。文章首先澄清了LLM、多模态、AIGC三者间的关系,指出不应在宏观概念上纠结,而应聚焦于具体技术栈和岗位定位。接着,文章详细分析了市场招聘需求,将大模型相关岗位分为训练研发、应用落地、多模态研发和AI基础设施四类,并对其要求、现实情况及性价比进行了排序。文章强调,大模型应用落地结合工程能力性价比最高,多模态潜力大但门槛高,纯AIGC(图像/视频生成)需谨慎选择,而AI基础设施虽稀缺但偏系统开发。此外,文章还探讨了方向的“保质期”、个人起点、组合稀缺性等因素,并结合作者自身经历给出建议。最后,文章总结出选择方向的决策步骤,鼓励读者基于充分信息做出合理选择,并通过执行力将选择转化为正确路径。

说实话看到这个问题我心里咯噔了一下,因为这不就是我自己半年前纠结的东西吗。

先交代一下我的情况。中科院计算机硕士在读,AI方向,还没毕业。研一上学期的时候导师给了我一定的自由度让我选细分方向,我在这三个方向之间反复横跳了将近两个月,最后做了选择。

这两个月里我做了大量的功课——翻招聘网站上的岗位、找不同方向的师兄师姐聊、问实习时的mentor、看各个方向近两年的技术演进趋势、甚至统计了一下几个方向在牛客上的offer讨论帖数量和薪资分布。

不敢说我的选择一定是对的,毕竟还没经过市场检验。但至少我做这个选择的过程是认真的,背后的分析框架可能对你有参考价值。

首先,这个问题的问法本身就需要修正

“LLM、多模态、AIGC选哪条路”——这个分类方式是有问题的。

这三个概念不是并列关系。它们之间有大量的重叠,而且边界正在变得越来越模糊。

我画个关系图你就明白了:

┌─────────────────────────────────────────────┐ │ 大模型(Foundation Models) │ │ │ │ ┌──────────────┐ ┌──────────────────┐ │ │ │ 纯语言LLM │ │ 多模态大模型 │ │ │ │ │ │ │ │ │ │ GPT系列 │ │ GPT-4V/4o │ │ │ │ Claude │◄──►│ Gemini │ │ │ │ GLM/Qwen │ │ Qwen-VL │ │ │ │ │ │ │ │ │ └──────────────┘ └──────────────────┘ │ │ │ │ ┌──────────────────────┐ │ │ │ 生成式模型 (AIGC) │ │ │ │ │ │ │ │ 文本生成(LLM本身) │ │ │ │ 图像生成(SD/DALL-E)│ │ │ │ 视频生成(Sora等) │ │ │ │ 音频生成 │ │ │ └──────────────────────┘ │ └─────────────────────────────────────────────┘

你看出来了吗?

LLM本身就是AIGC的一种(生成文本),而最新的LLM几乎都在走多模态路线(GPT-4o能处理文本、图像、音频)。所谓”纯语言大模型”正在变得越来越少——现在你很难找到一个头部模型是只处理文本的。

所以与其纠结”选哪个方向”,不如换一个更有操作性的问题:

在大模型这个大方向下,我应该选择哪个具体的技术栈和岗位定位,才能在就业市场上最大化我的竞争力?

这样问就清晰多了。下面我就按这个思路来分析。

一、先搞清楚市场上到底在招什么人


方向选择如果不跟就业市场的实际需求对照,就是在自嗨。

我前段时间花了大概一周时间,把几个主要招聘平台上跟大模型相关的算法岗JD做了一个粗略的分类和统计。样本不大,不严谨,但能看出趋势。

大模型相关的岗位大致可以分成这么几类:

第一类:大模型训练与基座研发

做什么: 预训练、SFT、RLHF/DPO对齐、模型架构改进、训练框架优化

谁在招: 头部大模型公司(智谱、百川、月之暗面、DeepSeek等)、大厂的基座模型团队

要求: 通常要求有预训练或大规模训练的经验,顶会论文是很大的加分项,对分布式训练有理解。门槛最高的一类岗位。

现实: 岗位数量少,因为需要做基座模型的团队本身就不多。而且这类岗位更偏research性质,很多团队倾向于招博士或者有顶会paper的硕士。

第二类:大模型应用与落地

做什么: RAG系统搭建、Agent开发、Prompt工程、大模型在具体业务场景的适配和优化、微调和部署

谁在招: 几乎所有大中型公司都在招,因为现在每个公司都想把大模型接入自己的业务

要求: 熟悉主流大模型的使用和微调,有实际的应用开发经验,工程能力要求比第一类低但也不能太差

现实: 岗位数量最多、增长最快的一类。但也正因为门槛相对低,竞争的人也最多。同质化比较严重——大家都会调API、都做过RAG,怎么做出差异化是个问题。

第三类:多模态模型研发

做什么: 视觉语言模型(VLM)、文生图/文生视频模型、多模态对齐、多模态数据处理

谁在招: 做多模态的大模型公司、大厂的多模态团队、做AIGC产品的公司(图像生成、视频生成等)

要求: 通常需要CV或多模态的研究背景,对图像/视频的处理pipeline有了解,有相关论文或项目经验

现实: 需求在快速增长,因为多模态是大模型技术演进的明确方向。但供给端也在跟上——很多原来做CV的人在往多模态转。(特别是现在大厂哈哈哈)

第四类:AI基础设施与推理优化

做什么: 模型推理加速、训练框架开发、GPU调度优化、模型量化压缩、serving系统搭建

谁在招: 所有做大模型的公司都需要,而且非常缺

要求: 扎实的系统编程能力,了解GPU架构和CUDA编程,理解模型的计算流程

现实: 这类岗位严格来说不算”算法岗”,更偏系统开发。但我把它列在这里是因为它跟大模型紧密相关,而且供需关系是这几类里面最好的——需求大,能做的人少。(咳咳,具体怎么知道的,感觉出来的哈哈哈哈,要是有大佬有不同意见)


看完这个分类,你可能已经有一些感觉了。让我把结论说得更明确一些。

二、我的判断:从就业角度看,各方向的性价比排序


以下纯属我个人基于收集到的信息做出的判断,不一定对,但每一条都有我的理由。

性价比最高:大模型应用落地 + 工程能力

原因很直接:岗位数量最多、需求增长最快、门槛可高可低。

“可高可低”是什么意思?就是这个方向的下限很低(谁都能调个API做个demo),但上限很高(把一个大模型应用做到真正好用、稳定、高效,涉及到大量的工程挑战和技术深度)。

如果你只停留在”会调API”“做过RAG demo”这个层面,你的竞争力很弱——因为这个层面的人太多了。

但如果你能做到以下几点中的任何一两个,你的竞争力就会显著提升:

  • 深入理解RAG系统的各种坑并且有实际的解决方案(检索质量优化、记忆管理、幻觉控制等)
  • 能搭建可靠的Agent系统,对模型的失败模式和边界有深入认知
  • 有模型微调的实战经验,知道什么时候该微调、什么时候该用prompt engineering
  • 了解模型推理的基本优化手段,能跟基础设施团队有效沟通

本质上就是:在”应用”这个大家都能做的方向上,用工程深度做出差异化。

这条路对硕士来说最友好,因为不需要顶会论文、不需要预训练经验,但需要你真的动手做过完整的项目,踩过坑,解决过问题。(再不济,你用AI跑一跑,然后了解了解代码哈哈哈哈哈)

潜力最大但门槛也高:多模态

多模态是大模型技术演进的确定性方向。从GPT-4V开始,所有头部模型都在往多模态走。这不是一个”可能会火”的方向,而是一个”一定会火而且正在火”的方向。

从就业角度看,多模态方向的优势在于供给端还没有完全跟上。做纯NLP的人很多,但同时懂NLP和CV、能做多模态对齐和融合的人还是相对少的。这种供需差意味着溢价。特别是有一说一,现在大厂对于这方面的人才给钱还是非常慷慨的。

但门槛也确实更高:

  • 你需要同时掌握NLP和CV的基础知识
  • 多模态的数据处理比纯文本复杂得多
  • 这个方向的研究进展非常快,你需要持续跟进最新的工作

如果你有CV的背景,或者对图像和视频处理有兴趣和基础,这条路是值得认真考虑的。

如果你完全没有CV的基础,纯从零开始学多模态,时间成本会比较高。两年的硕士时间够不够同时补CV基础和做出有深度的多模态项目,需要你自己评估。

需要谨慎的方向:纯AIGC(特指图像/视频生成)

这里我单独把AIGC中的图像和视频生成拎出来说,因为这个细分方向的就业情况比较特殊。

从技术上看,Stable Diffusion、DALL-E、Sora这些模型确实非常亮眼,技术上有很多有意思的问题值得研究。

但从就业角度看,我的观察是:

做图像/视频生成的算法岗位,数量不算多,而且高度集中在少数几家公司。 不像大模型应用岗位那样几乎每家公司都有需求,生成式模型的研发主要集中在专门做AIGC产品的公司和大厂的特定团队。

而且这个方向的研究门槛比较高——Diffusion Model的理论基础涉及到随机微分方程、变分推断等数学工具,要做出有竞争力的成果需要比较扎实的数学功底和研究能力。

如果你对这个方向有强烈的兴趣和一定的数学基础,可以做。但如果你的目标纯粹是就业,性价比不是最高的。(当然了,最近AI漫剧什么的比较火,可能也是一个方向吧,不过个人觉得性价比不是很高,只是个人看法哈哈哈哈)

最稀缺但可能不是你想走的路:AI基础设施

前面提到了这个方向。它的供需关系是所有方向里最好的——极度缺人。

但这个方向本质上是系统开发岗,不是传统意义上的算法岗。日常工作是写C++/CUDA、做性能优化、搭分布式系统,跟”炼模型”“做实验”关系不大。一个东南的大学同学,他就想做这个方面

如果你的兴趣和能力本来就偏系统和工程,这是一条非常好的路。但如果你选这个方向是因为”好就业”而不是因为你喜欢做底层系统的活,你可能会比较痛苦。

三、一些不太好分类但很重要的考虑


考虑一:方向的”保质期”

这个是我花了很长时间才想清楚的事情。

选方向不能只看当下的热度,还要估一下这个方向的知识和经验在多长时间内还有效。

特别是去年,很多大厂开了非常高的大包给算法岗,我预言未来几年算法岗的竞争会越来越卷,以至于可能性价比不是很高。

大模型应用落地——保质期中等。具体的工具和框架会变(今天用LangChain明天可能用别的),但”怎么把模型用好”“怎么解决落地中的工程问题”这种方法论层面的经验保质期比较长。

多模态——保质期较长。多模态是一个大的技术趋势,不是一阵风。即使具体的模型架构会迭代,”让模型理解和生成多种模态的信息”这个方向在可预见的未来都是重要的。

纯AIGC(图像/视频生成)——保质期不确定。这个领域技术迭代极快,半年前的SOTA可能现在就过时了。你积累的具体技术经验可能贬值很快,但底层的数学基础和对生成模型的理解是持久的。

纯语言LLM——保质期存疑。不是说LLM不重要了,而是”纯语言”这个定语的保质期在缩短。未来的模型大概率都是多模态的,”只懂处理文本”可能会变成一种局限。

考虑二:你的起点在哪

这一点经常被忽视但其实非常关键。

硕士的时间很短,你不可能从零开始在一个全新的方向做到有竞争力。你必须基于你已有的积累来选择方向。

说得直白一点:你本科阶段和研一上学期做过什么,会很大程度上限定你的选择范围。

几种常见的起点和对应的建议:

如果你本科做过NLP相关的工作(文本分类、信息抽取、机器翻译等),你往大模型应用落地方向转是最自然的。你对文本处理的基础理解可以直接复用,学习曲线最平滑。如果你的NLP基础特别扎实,也可以往大模型训练和对齐方向冲一冲,但可能需要补分布式训练的知识。

如果你本科做过CV相关的工作(目标检测、图像分割、图像生成等),你往多模态方向转有天然优势。现在多模态领域最缺的就是同时懂CV和NLP的人,而你已经有了一半的基础。补上Transformer和LLM的基础知识之后,你在多模态方向的竞争力会比纯NLP背景的人更强——因为NLP的人想做多模态也得补CV,而CV的基础通常比NLP更难补。

如果你本科做过传统机器学习或数据挖掘(推荐系统、CTR预估等),你可以考虑大模型在推荐/搜索/广告场景的应用。这是一个很实际的落地方向,大厂有大量的岗位需求。你对业务指标和特征工程的理解是大模型背景的人通常不具备的,这可以成为你的差异化优势。

如果你本科啥都没做过或者做的方向跟AI关系不大——那说实话,两年时间要做到有竞争力,挑战不小。我的建议是选一个入门门槛相对低、但可以通过项目积累深度的方向,也就是大模型应用落地。避开需要大量研究积累才能出成果的方向(基座模型训练、AIGC底层研究等)。

并且实在不行,自己做一些小产品就使用AI做一些小产品,然后自己看看能不能盈利,这个我觉得是一个很好的想法。

考虑三:不要忽视”组合稀缺性”

这个概念是我跟mentor聊天时他提到的,我觉得特别有启发。

在就业市场上,单一能力的价值是递减的——会用大模型的人越来越多,你再怎么卷也只是”又一个会用大模型的人”。

但两种能力的组合往往能产生远超单项之和的价值。 因为同时具备两种能力的人数量比只具备一种的人少得多。

几个我观察到的高价值组合:

大模型 + 系统工程 → 能把模型稳定高效地跑在线上,极度稀缺 大模型 + 垂直行业知识 → 能在金融/医疗/法律等领域做深度落地 大模型 + 数据工程 → 能搞定从数据清洗到模型训练的全链路 多模态 + 端侧部署 → 能在手机/车载等资源受限场景做多模态 NLP + CV → 多模态方向的理想人选

你选方向的时候,不要只想”我在哪个方向上能做到top”,也想想”我能不能组合两个方向形成一个独特的定位”。

后者在求职时的辨识度比前者高得多。面试官每天看到的简历里,”做过大模型微调”的一大把,但”做过大模型微调并且能自己写推理优化代码把延迟降下来”的人就少很多了。

四、我自己最后怎么选的


说了这么多分析,交代一下我自己的选择,不然显得光说不练。

我最终选的是大模型应用落地方向,同时有意识地在工程能力上做深度投入。

原因很坦诚:

第一,我本科的积累偏NLP,往这个方向转最顺畅,时间成本最低。

第二,我对自己的定位很清醒——我不是那种能在两年内做出顶会paper的选手。与其在研究方向上跟大佬硬卷,不如在应用落地方向上用工程深度做差异化。这更符合我的能力结构。

第三,这个方向的岗位数量最多,就业市场上的容错空间最大。万一某个细分方向冷了,我的基础能力还能让我往相邻方向迁移。

第四,我对系统工程确实有兴趣。做RAG系统的过程中我发现自己花在工程优化上的时间比花在模型调优上的时间多,而且前者比后者更让我有成就感。这个自我认知帮我确认了”应用+工程”这个定位是适合我的。

选完之后我做了几件具体的事情来落地这个选择:

研究课题围绕RAG和Agent系统展开,但重点不是提出

最后

对于正在迷茫择业、想转行提升,或是刚入门的程序员、编程小白来说,有一个问题几乎人人都在问:未来10年,什么领域的职业发展潜力最大?

答案只有一个:人工智能(尤其是大模型方向)

当下,人工智能行业正处于爆发式增长期,其中大模型相关岗位更是供不应求,薪资待遇直接拉满——字节跳动作为AI领域的头部玩家,给硕士毕业的优质AI人才(含大模型相关方向)开出的月基础工资高达5万—6万元;即便是非“人才计划”的普通应聘者,月基础工资也能稳定在4万元左右

再看阿里、腾讯两大互联网大厂,非“人才计划”的AI相关岗位应聘者,月基础工资也约有3万元,远超其他行业同资历岗位的薪资水平,对于程序员、小白来说,无疑是绝佳的转型和提升赛道。


对于想入局大模型、抢占未来10年行业红利的程序员和小白来说,现在正是最好的学习时机:行业缺口大、大厂需求旺、薪资天花板高,只要找准学习方向,稳步提升技能,就能轻松摆脱“低薪困境”,抓住AI时代的职业机遇。

如果你还不知道从何开始,我自己整理一套全网最全最细的大模型零基础教程,我也是一路自学走过来的,很清楚小白前期学习的痛楚,你要是没有方向还没有好的资源,根本学不到东西!

下面是我整理的大模型学习资源,希望能帮到你。

👇👇扫码免费领取全部内容👇👇

1、大模型学习路线

2、从0到进阶大模型学习视频教程

从入门到进阶这里都有,跟着老师学习事半功倍。

3、 入门必看大模型学习书籍&文档.pdf(书面上的技术书籍确实太多了,这些是我精选出来的,还有很多不在图里)

4、AI大模型最新行业报告

2026最新行业报告,针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

5、面试试题/经验

【大厂 AI 岗位面经分享(107 道)】

【AI 大模型面试真题(102 道)】

【LLMs 面试真题(97 道)】

6、大模型项目实战&配套源码

适用人群

四阶段学习规划(共90天,可落地执行)
第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范
第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署
第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建
第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型

  • 带你了解全球大模型

  • 使用国产大模型服务

  • 搭建 OpenAI 代理

  • 热身:基于阿里云 PAI 部署 Stable Diffusion

  • 在本地计算机运行大模型

  • 大模型的私有化部署

  • 基于 vLLM 部署大模型

  • 案例:如何优雅地在阿里云私有部署开源大模型

  • 部署一套开源 LLM 项目

  • 内容安全

  • 互联网信息服务算法备案

  • 👇👇扫码免费领取全部内容👇👇

3、这些资料真的有用吗?

这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/14 16:16:07

打卡信奥刷题(3111)用C++实现信奥题 P7310 [COCI 2018/2019 #2] Deblo

P7310 [COCI 2018/2019 #2] Deblo 题目描述 给定一个包含 nnn 个结点的树,其中每个结点都有一个权值。一条路径的权值定义为该路径经过的所有结点的权值异或后的结果。 你的任务是求出所有路径的权值之和。 输入格式 第一行输入正整数 NNN,表示树的…

作者头像 李华
网站建设 2026/4/15 16:45:40

Flutter中使用url_launcher实现多应用市场评分跳转的完整指南

Flutter跨平台应用市场评分跳转实战:从原理到高阶优化 在移动应用生态中,用户评分直接影响着应用商店的排名和用户下载决策。根据Sensor Tower的研究数据显示,平均星级提升0.1分可以带来高达15%的下载量增长。对于Flutter开发者而言&#xff…

作者头像 李华
网站建设 2026/4/15 17:27:40

Siemens NX GPU加速演进史:从光线追踪支持到图形性能飞跃

1. Siemens NX GPU加速技术发展概述 Siemens NX作为工业设计领域的标杆软件,其图形处理能力的进化史堪称一部硬件加速技术的编年史。记得我第一次接触NX 1847版本时,即使配备了当时顶级的RTX 2080显卡,开启光线追踪功能后仍然卡顿得让人抓狂…

作者头像 李华
网站建设 2026/4/14 16:09:24

LiuJuan20260223Zimage实战体验:输入提示词,秒出专属风格图片

LiuJuan20260223Zimage实战体验:输入提示词,秒出专属风格图片 1. 引言:一个简单却惊艳的专属图片生成器 你有没有想过,只需要输入一个名字或一个简单的词,就能立刻得到一张风格独特、质量上乘的图片?不是…

作者头像 李华
网站建设 2026/4/14 16:07:34

运维工程师的AI利器:Phi-3-mini自动化巡检脚本生成与日志分析

运维工程师的AI利器:Phi-3-mini自动化巡检脚本生成与日志分析 1. 运维自动化的新选择 凌晨三点,服务器告警铃声又一次把张工从睡梦中惊醒。作为拥有8年经验的运维工程师,他早已习惯了这种"救火队员"式的工作节奏。但最近&#xf…

作者头像 李华
网站建设 2026/4/14 16:05:23

【限时解禁】SITS2026白皮书未公开附录曝光:含8项评测基准原始数据、3家头部厂商闭门测试对比表

第一章:SITS2026发布:多模态大模型白皮书 2026奇点智能技术大会(https://ml-summit.org) SITS2026白皮书正式定义了新一代多模态大模型的架构范式与评估基准,聚焦于跨模态对齐、实时推理压缩与人类意图可解释性三大核心突破。该白皮书由全球…

作者头像 李华