目录
1.OpenClaw的定义
2.OpenClaw的基本架构
3.tools,skills,plugins
4.OpenClaw的缺陷
(1)长上下文管理
(2)安全边界
5.OpenClaw与Claude Code的区别
想快速了解OpenClaw,可以先看看这个视频:
一个视频搞懂OpenClaw!_哔哩哔哩_bilibili
接下来详细讲一下OpenClaw。
1.OpenClaw的定义
OpenClaw 的官方定位不是“一个聊天机器人”,而是一个self-hosted(自托管)的 AI agent gateway:你在自己的机器或服务器上运行一个长期存活的Gateway进程,它把 WhatsApp、Telegram、Slack、Discord、Signal、Google Chat、WebChat 等消息入口连接到一个可持续工作的 AI 助手。官方文档强调它是local-first / self-hosted、多渠道、面向 agent 的系统,适合想从任意聊天入口唤起个人 AI 助手、又不想把控制权完全交给托管服务的开发者和高级用户。也就是说,OpenClaw 不是“网页上和模型对话”的产品,而是一个把 LLM、工具、会话、记忆、消息通道和设备能力编排到一起的运行时。它的设计目标是让你像给人发消息一样,给一个常驻 agent 发任务,然后 agent 可以读文件、跑命令、查网页、发消息,甚至连接手机节点去调用摄像头、定位、录屏等设备能力。
与function-calling agent的区别:
2.OpenClaw的基本架构
OpenClaw的架构可以分为三层:
① 入口层:各种聊天渠道和WebChat;
② 控制层:Gateway,负责会话、路由、认证、事件、状态。一个长期运行的Gateway拥有所有消息入口;控制端客户端(CLI、macOS app、Web UI、自动化)通过 WebSocket 连到 Gateway;移动或桌面节点也通过 WebSocket 连接,但以 role: node 的方式暴露自己的设备能力。一个Gateway可以同时服务多个内建或插件渠道,并支持多agent路由和隔离会话。
③ 执行层:模型+工具+节点设备能力。在模型侧,它运行一个 Agent Runtime 作为决策引擎,不绑定特定模型,支持在云端或本地灵活部署并与大模型能力深度集成;在工具侧,所有技能以 YAML/JSON 脚本形式定义并动态加载,已内置了文件处理、Shell命令、浏览器自动化等数十个 Skill,执行前会先通过沙箱和权限检查来确保安全性;在设备侧,它通过抽象操作指令集(AOIS)统一了与本地节点和远端设备的交互接口,让同一个执行逻辑能无缝对接不同硬件的底层驱动,实现跨平台的自动化控制。
3.tools,skills,plugins
(1)tools
工具是agent真正调用的执行能力。官方文档把tool定义为“模型可调用的typed function”,例如exe