news 2026/1/22 15:31:18

AI编程大地震!Meta 20亿收购Manus AI,通用智能体要革开发者的命?

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
AI编程大地震!Meta 20亿收购Manus AI,通用智能体要革开发者的命?

01 Meta 为什么买下 Manus?

2025 年底,科技圈发生了一笔极具象征意义的交易:Meta 斥资超 20 亿美元收购初创公司 Manus AI。

很多人第一反应是错愕:“那个做 VR 手套的公司这么值钱?”(荷兰的 Manus XR)

错。 Meta 这次买的不是元宇宙的“手套”,而是 AI 时代的“双手”——一家主打通用智能代理(Generalist Agent)的中国公司—— Manus AI。

过去两年,我们见证了大模型的奇迹,但更多时候,它们像是一个“懂很多的教授”,能陪你聊天,却无法帮你订一张机票。而 Manus 的核心价值在于,它展示了一种可能性:AI 不再只是对话框里的文字生成器,而是可以接管浏览器、编写代码、操作软件的“执行者”。

OpenAI 和 Google 早已在通用 Agent 领域布局,OpenAI 有 “Operator”,Google 有 “Project Jarvis”,而 Meta 此前的重心一直在“模型开源”和“元宇宙”上。

这次略显昂贵的技术并购,可能是 Meta 的一次被迫战略补位,但也进一步确认了一个行业共识:通用 Agent(智能体)的竞争将进一步爆发。

而在欢呼之前,我们需要搞清楚:这个被给予厚望的“通用 Agent”,到底想革谁的命?

02 愿景:通用 Agent 为何被视为 App 的终结者?

我们正在经历一个工具过剩、但效率并未倍增的时代。

手机里躺着几十个 App,我们被迫在不同的界面间跳转:为了订票打开 A,为了比价打开 B,为了记账打开 C。

  • App 的底层逻辑是“人适应机器”:开发者把功能封装好,用户去学习怎么用。
  • Agent 的底层逻辑是“机器适应人”:用户只给目标,机器去拆解过程。

通用 Agent 之所以被视为下一代计算平台(Next Computing Platform),是因为它试图解决 App 时代无法解决的三个顽疾:

1)从“功能切片”回归“完整意图”

App 服务的是被拆碎的行为(拍照、打车、支付)。而通用 Agent 服务的是完整的意图。

当你对 Agent 说“帮我规划一次东京旅行”,它不再是你手机里的第 51 个 App,而是一个“超级入口”。它在后台自主调用浏览器、地图、订票接口。用户不再需要为了“做事”而不断处理“如何做事”的前置步骤。

2)真正的“一次性软件”革命

这是通用 Agent 最具颠覆性的愿景:生成式软件(Generative Software)。

在 App 时代,为了偶尔算一次房贷,你需要下载一个 50MB 的计算器应用,让它长期占用你的手机内存。

在 Agent 时代,当你提出需求时,通用 Agent 可以利用代码解释器,现场为你写一个只包含计算功能的微型程序。用完即走,代码销毁。

未来的软件可能不再是固定的资产,而是一种随需随到的“流”。

3)商业模式的跃迁:Service-as-Software

App 卖的是工具(Tool),你买回来得自己干活。

Agent 卖的是服务(Service),你付出金钱,得到结果。

这种从“卖铲子”到“卖金子”的转变,让软件行业第一次有机会真正通过替代人力来获取价值,天花板被无限拔高。

03 路径:不只是“全能神”,更是“指挥家”

那么,未来的 Agent 真的是一个无所不知、无所不能的超级 AI 吗?

并不是。行业目前更倾向于另一种演进路径:多智能体协作(Multi-Agent Orchestration)。

这就是所谓的“前端通用,后端专业”。

  • 通用 Agent(如 Manus):它是唯一的“入口”(Interface)和“调度者”。它负责听懂人话,拆解任务,然后把活派出去。
  • 专业 Agent(如 Devin, Harvey):它们是后台的“劳动力”。它们可能不懂聊天,但在写代码、审合同、做财报等垂直领域拥有极高的专业度和准确度。

未来的理想工作流是:

用户向 Manus(管家) 下达指令 -> Manus 呼叫后台的 Devin(程序员) 写代码 -> 同时呼叫 Harvey(律师) 审核合规 -> 最后由 Manus 整合结果汇报给用户。

这种“通用入口 + 专业分工”的模式,被认为是平衡成本、效率与专业度的最佳解法。它让用户感觉拥有了一个全能管家,而管家背后其实站着一个专业的专家团队。

04 泼冷水:被刻意忽视的三只“灰犀牛”

愿景很性感,但现实很骨感。

Meta 的超20亿美金虽然表明了方向,但并未解决路途中的沼泽。如果我们剥离掉资本的滤镜,会发现通用 Agent 目前面临着三个结构性、甚至可能是无解的难题。

1) 结构性悖论:用“猜”的模型,去干“定”的活

这是行业内心照不宣的房间里的大象。我们试图用 LLM(大语言模型)去做 Agent,这本身可能就是一种错配。

大模型的本质是基于概率的“下一个词预测”(Next Token Prediction)。它的基因里写着“创造”与“随机”,这意味着它天生会胡说八道(幻觉)。

Agent 的任务(如转账、删文件、部署代码)要求的是 100% 的确定性与精确性。

这是基因层面的冲突。

让一个只会“概率吟唱”的诗人去操作精密的手术刀,可靠性难题是结构性的。只要模型依然基于概率,它就永远无法像传统软件那样承诺 100% 的执行准确度。在企业级应用中,99% 的准确率和 0% 没有区别——因为没人敢承担那 1% 删库跑路的风险。

2) “一次性软件”的工程黑洞

“现场生成代码、用完即走”听起来是科幻般的终极形态,但在工程落地时,它目前更像是一个成本与安全的黑洞。

  • 安全死结:让 AI 实时生成可执行代码并在用户终端运行,等同于在这个充满恶意软件的世界里“裸奔”。谁来审核这段临时代码没有后门?谁来保证它不会误删系统文件?如果加上重重沙盒与审核,响应速度又会慢到不可接受。
  • 算力账本:为了算一个房贷,它需要调动千亿级参数的大模型去理解意图、规划步骤并生成计算指令,再调用专门的代码解释器来执行。这背后的每一次大模型调用、每一次工具调度都意味着不菲的成本。这就像为了喝一杯水,我们需要启动一座庞大的水泵站并铺设临时管道。
  • 结果验证:如果没有 App 的固定界面,用户如何一眼判断 AI 生成的计算器逻辑是对的?“验证结果”的认知成本,可能比“直接操作”还要高。

3) 缺失的“操作系统”

关于上文提到的“通用入口+专业 Agent”的未来图景,目前也被过于简化了。

大家都在谈论 Agent,却没人谈论 Agent 之间的“语言”。

如果 Meta 的通用 Agent 要指挥 Adobe 的修图 Agent 和 Salesforce 的销售 Agent,它们通过什么协议通信?谁来定义接口标准?

  • 如果是 Meta 定义,Google 会答应吗?
  • 如果是 Apple 定义,OpenAI 会兼容吗?

实现多智能体协作,最难的不是造智能体,而是造“社会规则”。

目前我们极度缺乏一个类似 iOS 或 Android 的“Agent OS”或统一协作框架。没有这个“红绿灯系统”,成千上万个 Agent 放在一起,带来的不是协作,而是混乱的巴别塔。

这也正是前段时间大热的豆包 AI 手机(Ola Friend)所面临的现实困境:即便有心做入口,却被卡在各大 App 的围墙之外,无法真正调动第三方服务。

05 结语

回到开头,Meta 收购 Manus,这笔交易确认了共识,也暴露了焦虑。在 OpenAI 和 Google 的夹击下,Meta 必须跟注。但这笔钱解决不了上述的结构性难题。

App 的围墙终将坍塌,软件将从“固定的工具”变成“流动的服务”,这个大方向可能没错。但在这个未来到来之前,我们还得在“概率与确定性”、“成本与体验”、“封闭与开放”的泥潭里,进行一场漫长的工程长跑。

那么,如何系统的去学习大模型LLM?

作为一名深耕行业的资深大模型算法工程师,我经常会收到一些评论和私信,我是小白,学习大模型该从哪里入手呢?我自学没有方向怎么办?这个地方我不会啊。如果你也有类似的经历,一定要继续看下去!这些问题啊,也不是三言两语啊就能讲明白的。

所以我综合了大模型的所有知识点,给大家带来一套全网最全最细的大模型零基础教程。在做这套教程之前呢,我就曾放空大脑,以一个大模型小白的角度去重新解析它,采用基础知识和实战项目相结合的教学方式,历时3个月,终于完成了这样的课程,让你真正体会到什么是每一秒都在疯狂输出知识点。

由于篇幅有限,⚡️ 朋友们如果有需要全套 《2025全新制作的大模型全套资料》,扫码获取~

👉大模型学习指南+路线汇总👈

我们这套大模型资料呢,会从基础篇、进阶篇和项目实战篇等三大方面来讲解。

👉①.基础篇👈

基础篇里面包括了Python快速入门、AI开发环境搭建及提示词工程,带你学习大模型核心原理、prompt使用技巧、Transformer架构和预训练、SFT、RLHF等一些基础概念,用最易懂的方式带你入门大模型。

👉②.进阶篇👈

接下来是进阶篇,你将掌握RAG、Agent、Langchain、大模型微调和私有化部署,学习如何构建外挂知识库并和自己的企业相结合,学习如何使用langchain框架提高开发效率和代码质量、学习如何选择合适的基座模型并进行数据集的收集预处理以及具体的模型微调等等。

👉③.实战篇👈

实战篇会手把手带着大家练习企业级的落地项目(已脱敏),比如RAG医疗问答系统、Agent智能电商客服系统、数字人项目实战、教育行业智能助教等等,从而帮助大家更好的应对大模型时代的挑战。

👉④.福利篇👈

最后呢,会给大家一个小福利,课程视频中的所有素材,有搭建AI开发环境资料包,还有学习计划表,几十上百G素材、电子书和课件等等,只要你能想到的素材,我这里几乎都有。我已经全部上传到CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

相信我,这套大模型系统教程将会是全网最齐全 最易懂的小白专用课!!

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/1/21 5:06:59

[精品]基于微信小程序的 健康管理系统UniApp

文章目录项目效果图开发核心技术介绍:SpringBoot和Vue 介绍系统测试详细视频演示源码获取项目效果图 项目编号:059 开发核心技术介绍: 本系统的开发环境如下: 操作系统:微软win10以上版本 开发平台&#xf…

作者头像 李华
网站建设 2026/1/22 11:18:22

GLM-TTS能否模拟醉酒状态?异常语音特征生成实验

GLM-TTS能否模拟醉酒状态?异常语音特征生成实验 在影视配音或虚拟角色交互中,我们常常希望语音合成系统不仅能“说话”,还能“演戏”——比如让一个角色听起来疲惫、激动,甚至醉酒。这些非标准状态下的语音往往带有明显的声学畸变…

作者头像 李华
网站建设 2026/1/5 17:27:27

【Redis锁机制深度解析】:PHP环境下分布式锁的可靠性与性能优化策略

第一章:Redis分布式锁的核心概念与PHP集成在高并发的分布式系统中,确保多个服务实例对共享资源的安全访问是关键挑战之一。Redis 因其高性能和原子操作特性,常被用于实现分布式锁机制。通过 SET 命令的 NX 和 EX 选项,可以在 Redi…

作者头像 李华
网站建设 2026/1/12 5:12:27

语音合成可用于游戏角色配音?NPC对话生成方案

语音合成可用于游戏角色配音?NPC对话生成方案 在开放世界游戏里,你是否曾因为某个NPC重复播放同一句“欢迎光临”而瞬间出戏?又或者,在一款剧情驱动的RPG中,面对成百上千条任务对白,开发团队不得不花费数月…

作者头像 李华
网站建设 2026/1/20 4:26:02

GLM-TTS能否嵌入HTML页面?前端语音播报功能实现

GLM-TTS能否嵌入HTML页面?前端语音播报功能实现 在智能客服、在线教育和无障碍阅读日益普及的今天,用户对网页交互体验的要求早已不再满足于“能看”和“能点”。越来越多的应用场景开始追求“能听”——即让文字内容自动转化为自然流畅的语音输出。这种…

作者头像 李华