DeepSeek R1后应用、职业与行业影响——2025年梳理

突然就想写点应用、开发相关的东西，一方面是不断有企业和朋友问我他们可以用DeepSeek做什么，怎么用；另一方面是这个方向的职业、行业也在不知不觉中慢慢改变。干脆顺便一起梳理一下，记录在案。

行业变化

主要从就业、应用和研究三个方面展开讨论。

就业

其实DeepSeek（或者ChatGPT）爆火后，最着急的应该是一线的NLP、LLM从业人员，本人正好也属于其中一员。专门做大模型的团队（类似DeepSeek、达摩院等）本就很少，门槛更是极高，导致大多数从业人员还是集中在“应用”和“业务”侧。但是LLM发展又如此迅猛，搞应用的门槛不断降低，这点我在23年的《ChatGPT 影响冲击：职业、行业与产业 | Yam》一文中就提过了，当时就深感焦虑。R1出来后，所有的LLM大概都会R1一下，而且他还在不断进化，LLM越来越聪明，我们的焦虑越来越多。

现在明显能感觉到的趋势就是大量的应用相关职位，几乎都是Agent开发，不需要训练模型，但对工程能力有要求；反过来，如果是工程开发人员，则要求了解算法基本知识。按理说职位变多不应该焦虑才对，但其实虽然职位变多了，但“好职位”不多。而且因为职位变多，导致进入的人更多，这里面包括之前就搞NLP的、之前搞开发的、其他领域转行的，以及大量毕业生的涌入。我觉得这个趋势不可挡，而且会愈演愈烈。当LLM聪明到一定程度后，剩下的就是大量的应用工作。LLM还要不要继续研究了？当然要！但那只是不到1%的人和企业要做的，突破是渐进式的，不可能一下跨出一大步，足够聪明的LLM已经足够在很多地方发力了，整个社会的跟进需要时间。等到下一次大突破，无非就是重新再来一遍现在的循环。

应用

一年前的Agent可能还比较简单，现在的Agent已经相当复杂了，虽然一句话完成一个需求（如MetaGPT）目前大部分时候还不可用，但这一定是暂时的。一方面AI还在不断进步，另一方面，Agent相关的标准在不断完善（如MCP）。一旦很多东西标准化了，AI表现出来的威力会突破性的加强。根据我自己的经验，目前的Agent在做复杂任务时有一个非常大的毛病——中间某个环节出问题后，需要耗费非常多的时间和Token才有可能解决，很多时候还解决不了。这当然可能是AI不够聪明，但更多的问题还是标准化不足，类似MCP这样的协议有望解决这一问题。

顺便科普一下，简单来理解，MCP就是把与LLM交互的各种组件统一成不同的模块服务，它提供了一种将 AI 模型连接到不同数据源和工具的标准化方式。从LLM的角度看，它标准化了应用程序如何为 LLM 提供上下文。举个例子，比如你让LLM帮你在电脑里找一个文件，一般我们都会借助一个软件来完成（比如Windows的Everything、Linux的find命令等），这时候就可以写一个类似的Server（比如就叫Everything MCP Server），然后LLM就通过这个Server使用具体的软件，LLM侧是比较清爽简单的，所有“变”和“不一样”的东西都放在这个MCP Server这里，类似于一个适配于LLM的Adapter。我只能说，潜力无限！在此之上就是各种Agent工具啦，比如现在比较有名的扣子，它允许用户通过工作流的方式创建复杂Agent和应用。我相信它底层的通用模块应该也是有类似MCP Server这样的Adapter的。随着Agent和应用不断复杂，是一定需要单独抽一层这样的Adapter出来的。

研究

多模态自不必说，就LLM方向其实也还有蛮多可以做的工作，尤其是和RL结合，大有可为（感兴趣的读者可以关注hscspring/rl-llm-nlp: Reinforcement Learning in LLM and NLP.）。这里顺带说一下我自己的两个感觉。第一个就是LLM相关的前言论文大部分都来自国内机构或华人作者，这个趋势近两年是越来越明显，中国人的卷真不是吹的。第二个就是高品质前沿资料也开始集中在中文社区，尤其是知乎和微信公众号，有不少高质量的内容，虽然也不是很多，但相比英文社区貌似好很多。现在搜索前沿内容，能搜到的英文社区的资料越来越少了。感觉R1之后，算法领域国内比国外沸腾的更厉害。

另一个方向是模型架构方面的优化，DeepSeek在这方面走的很快，近期提出了NSA，Kimi也提出了类似的MoBA，以及优化了新的更省资源的优化器Muon，还有YOLU-12对Attention架构的优化，近期何恺明大神的Transformers without Normalization。相关的工作层出不穷，且看起来都相当有吸引力。还有量化、蒸馏方向也不断有新的成果出现。

除此之外，Agent方向的算法也在逐步发展，比如搞Scaling的camel，以及相关的应用OWL，还有相关的具身智能、世界模型，AI方向的研究如火如荼。

值得一提的是，以上提到的很多研究都是国内公司或华人主导。R1之后，据说很多之前专搞LLM的都压力山大，不知道又在埋头憋什么大招。AI可能从来没像今天这样繁荣。这块内容就不展开多说了，实在是有点多，感兴趣的读者可以关注我的博客。

职业变化

这部分主要梳理岗位和职业方向的变化。

岗位

这里主要探讨一下大部分LLM算法工程师这个职业的工作内容，目前看来主要是下面这么几个方向。

第一，基于LLM做业务开发。说到做业务，Agent就是标配，最简单的Agent就是一个LLM+RAG，复杂的就涉及到多个LLM、多个环节、多个组件。这个工作内容的工程能力要求大于算法能力，尤其是架构设计能力。

第二，LLM模型优化。R1后出现了一些新的范式，让我们有可能用更低的成本和更小的模型达到更好的效果，小模型（SLM）的春天来了。无论从成本、效率还是端侧部署考虑，模型优化都值得投入，但投入确实不需要那么多。因为推理方向进展太迅速，成本下降趋势明显，当大模型的推理成本低到一定程度时，优化小模型就显得多此一举了。同等条件下模型越大效果越好，这是真理。

第三，Agent交互优化。这是个老瓶装新酒的方向，其实就是LLM前用强化搞Agent那一套。目前研究还不多，主要是业界都还处于“构建”Agent阶段，这个属于优化方向。等大部分Agent构建完成要进一步提升效果时，老瓶的RL可能会登场。

以上三个职位数量是逐个下降的，第一个应该能占到80%。这里没有写推理方向，因为这个方向你只能往底层做，那要求很高，而且其实算是另一个方向了。上层没太多意义，都是工具，而且部署大模型和业务是相对独立的，用户切换完全没成本，谁好谁快就用谁。从VLLM到SGLang就可见一斑。

除此之外，在专用领域做专用LM（Large Model）也是个不错的方向，但职位应该也不太多。顺便说一下，个人不是特别看好垂直领域（比如医疗、金融等）LLM，但非常看好专用领域（比如时序、分子）LM，后者的Token不再是文本。理由很简单：LLM足够聪明时，只要给它提供足够充分的上下文，应该足以解决大部分问题。

方向

这部分主要针对我自己，不一定对你有帮助，请谨慎参考。

我在2023年初开始做LLM，做了一年后感觉模型本身好像没啥可做的了，于是转到多模态做了一年，主要是文本+语音合成方向。R1出来后又开始重新思考方向，最终得出的结论是：LLM依然是核心，无论是多模态还是Agent，LLM才是最重要的。这一年做了几个月的OMNI，实在感觉语音模态要做到文本模态这种理解力（LLM最重要的是理解而非生成能力）过于艰难，事倍功半，模态集成应该就是最好的出路，我想图像应该也类似。其实这也与人脑类似，耳朵和眼睛都是信号接受装备，真正处理信号的还得是大脑，而LLM就是AI系统的大脑。鉴于此，未来算法的主方向应该还是会考虑LLM，不过会把一半重心放在RL上，走LLM+RL的路线，这也是我本人一直感兴趣的方向。

多模态的模态融合也是很好的方向，这里一定是“融合”，也就是如何在多模态中利用好LLM的能力。Pipeline级联模式当然是长期方案，但端到端、半端到端（类似Qwen-Audio）也在逐渐成熟。端到端模式在应用方面还是比较难，但作为研究方向会很有意思。

再就是Agent，这个方向总体是偏工程开发的，作为一个热爱写代码的程序员，应该可以作为长期方向坚持下去，具体方式可以是公司的业务服务，也可以是开源项目或软件。Agent的方向太简单没意思，比如RAG就实在是无趣的紧，但构建能自动完成复杂任务的Agent就非常有意思了，这里面甚至都不需要RAG，就是调用各种工具。其实关于怎么调用工具，除了前面提到的MCP，还有个完全基于图像的方法也挺有意思，比如Omniparser，它直接根据软件的图标进行选择使用。

如何使用

这部分主要梳理对企业和个人来说如何使用AI。在开始之前，先列一下之前几次分享中提到的一些观点。

LLM解决不了所有问题，甚至无法解决好某一个问题。
对产品来说，只有LLM是远远不够的，还需要相关配套。
LLM还没到完全替代人的时候，但能替代某一部分。
LLM只是工具，你不能把一切问题都交给工具。
每个人需要重新思考自己的工作，以及为什么工作。
不要觉得没用LLM就落后了，用了你可能也改变不了什么。

希望读者能从后面的分析中有所收获，即便没有也无需太过焦虑，时代洪流下，你即便往回游，最后也是向前走。

企业

对于企业，我总结了三个方向：

自动化流程：用AI替换掉某些流程或环节。比如：搜索、知识库、问答系统、智能客服等等。
提效：提升员工文字相关工作效率。比如：辅助招聘、文案创作、文档分析、教育培训等等。
新应用：以LLM为内核的创新产品。比如：虚拟员工、语音交互、复杂问题分析、任务规划拆解等等。

对企业来说，重点是把AI“用”在产品或服务里面。自动化流程比较自然，因为对准的就是已有的业务，后面两个其实都是新的。当做提效工具可能是大部分企业最直接、简单的想法，但对企业来说，不应该只停留在让员工自己使用类似DeepSeek、Kimi这样的工具，或者自己在扣子上找需要的Agent。企业应该做的是把各种AI能力整合进来，统一对员工提供使用窗口。

整合各种能力对企业来说是有很多好处的。首先，这样做可以让所有员工比较方便的借助AI能力（方便使用），否则可能会两极化：喜欢主动学习的员工用的很溜，不怎么关注新技术的员工完全不会用。有人说可以组织内部培训，的确如此，但这就得说第二个好处：降低使用门槛。AI相关的模型非常多，有的还不容易获取，让员工自己去探索，那大部分人可能只知道国内打广告比较多的几个，其他的就比较麻烦了。而且科学上网也会拦住一大堆人。第三，整合后可以统一优化，或动态选择不同能力的模型，从使用者的角度看就是效率更好、体验更好。最后，有个统一的使用窗口也能省掉员工的搜索、跟进、学习成本，公司整体效率更高。

整合能力可以是一个非常简单的聊天窗口界面，也可以针对自有业务进行优化改进。比如合同审核，是不是可以直接集成到已有系统，或者专门针对这类业务做一个页面。有些企业可能自己没有这样的开发能力，但我相信很快市面上就会出现很多提供类似服务的供应商，只需采购相关服务即可。其实钉钉、飞书等平台早就已经在自己系统里集成了大量的AI功能。

最后是新业务、新应用和新产品。这个需要企业根据自己业务实际情况重新设计了。我相信未来AI在企业中的使用就跟今天使用Word、Excel一样普遍和容易。我也相信AI会深入到企业每个业务方向，它将无处不在。

个人

对于个人，我也总结了三个方向：

当做专家：不明白就问他，主打学习。比如：学习辅导、专业咨询、行业问题等等。
当做朋友：不高兴就聊他，主打陪伴。比如：情感交互、情感建议、角色扮演等等。
当做助手：不想做就给他，主打提效。比如：写改文字、整理文档、解析问答等等。

其实对个人来说，我觉得不用AI也没什么关系。当然，很多时候你可能已经用了而不自知，比如你下了豆包APP，和其中的Agent打了个语音电话，这其实也算是一种使用，而且还用了不止一种AI能力（LLM和语音）。上面提到的三个方向，其实每一个都有一些对应的APP，围绕着我们的工作、学习和生活。

学习和生活这里就不多说了，稍微说一下工作场景。其实每个部门都能找到使用AI的场景，比如人力资源的六大模块。

规划：提供当前人才相关数据和企业战略目标，让AI分析整体规划。
招聘：用AI撰写岗位职责、任职要求，生成面试大纲，筛选、对比简历等。
培训：用AI自动完成培训PPT制作，培训完成后使用AI进行模拟测验，实时记录并在测试完给出评价等。
绩效：构建人才能力模型，根据员工表现和能力模型对比，生成培训方案和考核结果等。
薪酬：借助AI进行薪酬方案设计，进行薪酬数据分析等。
员工关系：活动方案、政策问答、离职访谈、意见整理等都可以使用AI完成。

其他如市场运营、行政办公、财务资金、稽核法务、物流配送等部门也类似。总之，只要我们理解了三个方向，总能找到它的用武之地。其实对工作场景来说，有条件的话最好的还是企业统一提供相关工具（上一小节）。个人需要与时俱进，企业更应该如此才是。

总结

本文从行业、职业和使用三个方面对AI（主要是LLM）近期的发展进行梳理讨论，主要是DeepSeek突然爆火后，好像所有企业、所有人都得用，不用就落伍了还是怎么了一样，R1之前好像也没这样。DeepSeek爆火是有原因的，但所有人都涌进来就有点奇怪了，很像股市火爆时大妈冲进去的样子，不知道这里面有多少人和企业是真心想拥抱AI的，又有多少是想冲一波浪跑路的。总之，AI势不可挡已成定式，无论如何，整个行业和生态的繁荣是真实的，我想，对一个从业人员来说，这就够了。

长琴

知乎：长琴 | 公众号：技术与人

DeepSeek R1后应用、职业与行业影响——2025年梳理

行业变化

就业

应用

研究

职业变化

岗位

方向

如何使用

企业

个人

总结