一、 为什么我们要了解智能AI(代理)
如果你没有抓住2012年微博的兴起,也错过了2015年抖音的流行,那么2025年的智能AI(代理)你可不要再错过。
要是你在2012年就开始认真发微博,2015年开始拍抖音短片,只要用心去做,一直改进,并且坚持下来,结果一定不会太差。在我看来,想要实现钱财上的自由,应该不会是大问题。
而今天,如果你不去了解和学习AI技术,未来可能就会失业,或者至少让你在未来的竞争中处于不好的位置。而智能AI(代理)是AI的升级版本,它的使用门槛更低,就算是不懂技术的人也能很快上手,而且功能更加强大。
你只要给智能AI(代理)定下一个明确的目标任务,它就会自己思考这个目标,然后把目标分成很多小步骤,自己生成需要输入的文字(提示),接着就开始行动,最后把任务目标完成。
我们来看一个具体的例子。
以前,要开发一个手机应用(APP),需要很多不同岗位的人,比如产品经理、设计师、开发人员、测试人员、维护人员等等,大家组成一个团队。这个团队需要经过设计方案、页面制作、编写代码、测试等多个环节,花很大的力气,最后才能把应用上线。整个过程时间很长、合作起来很困难、费用也高。
以后,即使没有专业的开发和测试人员,甚至都不需要懂产品的流程,只要通过智能AI(代理),就能开发出一个手机应用。
在这个过程中,也许用户完全不懂得编程,看不懂代码,甚至不知道开发一个应用需要哪些步骤,不清楚要给大的AI模型什么准确的指示,都不影响这个应用顺利开发并且上线。
这只是众多例子中的一个。
未来,像客服、翻译人员、写文章的人、编辑、做标准内容创作的人、市场调查分析师、最初级的数据分析员等很多工作岗位,都会因为智能AI(代理)的发展而受到影响和冲击,甚至会被取代。
根据知名咨询公司德勤(Deloitte)的预测,到2030年,全球大约有超过三亿个工作岗位,将通过智能AI(代理)重新实现自身的价值。
在这个时代,智能AI(代理)的发展速度非常快,未来可以发展的空间非常大,会超出大多数人的想象。现在,学习智能AI(代理)是一件非常重要,而且很有必要的事情。
二、 什么是智能AI(代理)
智能AI(代理)是一个聪明的软件系统,它具有感知周围环境、进行分析、做出决定和执行动作的能力。智能AI(代理)可以自己思考,通过大的AI模型来明白用户的要求,主动去规划和拆分小任务,并且能调用各种工具来完成这些任务。
智能AI(代理)的本质,是一个控制各种工具来解决问题的代理系统。
对于智能AI(代理)的定义,大家比较认可的是OpenAI的应用研究负责人Lilian Weng提出的:代理 = 大模型(LLM)+ 规划(Planning)+ 记忆(Memory)+ 工具(Tool)。
- 其中大模型就像是代理的大脑,在整个系统里起主导作用,提供推理的能力。
- 规划就是通过自己反思和思考的步骤,把要实现的目标一步步拆开,将大的任务目标分解成一个个小任务。
- 记忆负责储存信息。对于代理来说,通过有效的记忆机制,可以保证系统在面对各种复杂和新的问题时,能调出以前学到的知识和经验来处理。
- 记忆分为短期记忆和长期记忆。短期记忆指的是对话的上下文,会受到上下文窗口限制(例如GPT-4 Turbo可以处理约12.8万个词)。长期记忆则需要查询外部的数据库,通过快速搜索来获取。目前代理主要依靠长期记忆来完成各种复杂的任务。
- 智能AI(代理)和大的AI模型不一样的地方,在于代理能够使用外部工具来扩展模型的能力。在得到每一步的小任务后,代理会自己判断是否需要调用外部工具来完成这个小任务,然后把这个外部工具返回的信息提供给大模型,再进行下一步小任务的工作。
代理和普通的AI聊天机器人最大的不同,就在于它能够像人一样去解决问题。从长远来看,它会真正成为一个能“理解所有事情、处理所有事情、生成所有事情”的超级智能体。
我们来看一个具体的例子。
比如让字节跳动的Coze平台给你点外卖,它会让你告诉它你的位置、想吃什么和预算范围等信息。当你提供这些信息后,它会给你推荐适合的外卖平台、饭店、菜品和点餐的小技巧,但它不会帮你去下单。
而智能AI(代理)则可以帮你下单点外卖。
它会先分析“点外卖”这个目标,然后分解出怎样才能完成这个目标,具体有哪些步骤,规划出具体的等待执行的小任务。
接着它就按步骤执行,先调用工具选择外卖平台(如美团或饿了么),然后选择菜品,确认地址,并调用支付功能完成付款。
一些关键的步骤,比如支付环节,也可以授权给代理来完成,不需要人去干预。
智能AI(代理)厉害的地方,就在于它能够调用各种外部工具,帮助用户完成目标。
三、 智能AI(代理)面临的难题
虽然智能AI(代理)有很多优点,并且未来发展的潜力巨大,但是目前它还是面临一些挑战,存在不足。
获取数据比较难:数据的质量对于训练模型非常重要,但因为数据安全和隐私等问题,智能AI(代理)想要获取高质量的数据,难度比较大。
多工具协作问题:目前大部分智能AI(代理)协同多个工具一起工作的能力比较有限,大多数只能调用特定的、有限的应用工具,仍然无法实现广泛、灵活地与多个应用工具合作,这在一定程度上限制了它的功能使用和实际应用。
信任问题:大的AI模型通常是黑箱子模式,它内部的工作机制和做决定的过程,用户看不到,不透明。用户很难理解模型从输入到输出的详细过程,容易出现不信任的问题,影响了智能AI(代理)的广泛应用和推广。
责任归属问题:智能AI(代理)具有一定的自主性,它执行任务的方式和行为可能无法完全符合人类真实的意图。如果出现了不当的行为或者造成了损失,很难判断责任是属于开发者、使用者还是智能AI(代理)本身。例如,自动驾驶汽车在发生事故时,责任划分就是一个复杂的法律难题。
四、 展望未来
智能AI(代理)的时代已经到来。虽然目前它仍然面临一些挑战和不足,很多应用场景还不能完全实现,但是它未来的发展空间是无法想象的。
我们相信,今天的智能AI(代理)就像是微小的火星,未来必然会在很多领域和行业形成燎原的大火,并且带来前所未有的机会。
展望未来,可能只需要3到5年,智能AI(代理)很有可能会迎来更大的跨越式发展,会有更多的人了解和使用智能AI(代理),并且对各个行业、各个工作岗位进行重新构建。挑战和机遇是并存的,每个人都有弯道超车的机会。
这个时代,唯一不变的事情,就是变化。
对于个人来说,眼下最重要的建议,就是多用AI和智能AI(代理)。我们遇到的很多问题,都可以考虑让AI或智能AI(代理)给你提供帮助,甚至帮你处理,而不是用老办法自己去解决。
如何学习大模型 AI ?
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
第一阶段(10天):初阶应用
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
- 大模型 AI 能干什么?
- 大模型是怎样获得「智能」的?
- 用好 AI 的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向 GPT-3.5 灌入新知识
- 提示工程的意义和核心思想
- Prompt 典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt 攻击和防范
- …
第二阶段(30天):高阶应用
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
- 为什么要做 RAG
- 搭建一个简单的 ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的 RAG
- 搭建 RAG 系统的扩展知识
- 混合检索与 RAG-Fusion 简介
- 向量模型本地部署
- …
第三阶段(30天):模型训练
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
- 为什么要做 RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
- …
第四阶段(20天):商业闭环
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
- 硬件选型
- 带你了解全球大模型
- 使用国产大模型服务
- 搭建 OpenAI 代理
- 热身:基于阿里云 PAI 部署 Stable Diffusion
- 在本地计算机运行大模型
- 大模型的私有化部署
- 基于 vLLM 部署大模型
- 案例:如何优雅地在阿里云私有部署开源大模型
- 部署一套开源 LLM 项目
- 内容安全
- 互联网信息服务算法备案
- …
学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。
如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。