火爆的OpenClaw小龙虾到底干啥的？

来源 | 最后一个bug

最近科技界最火的莫过于OpenClaw，相信只要你或多或少也听说过，今天就来聊聊这个AI智能体OpenClaw。

OpenClaw，大家都叫他小龙虾，安装这个智能体的过程就叫"养虾"。

小龙虾

它是由奥地利程序员Peter Steinberger开发，核心slogan是“the AI that actually does things”（真正能干活的AI）。它因红色龙虾Logo、核心是用“钳子（claw）”执行操作、迭代逻辑对应龙虾蜕壳生长，所以大家才叫它“小龙虾”，也是GitHub历史上增速最快的开源项目之一，4个月星标突破25万+，说是已经超过了linux等长周期开源项目。

大伙都知道现在的ChatGPT等大模型只负责“出方案、给答案”，然而OpenClaw它也不是什么更加厉害的大模型，他只是给大模型装上了“眼睛、大脑、手和记忆”，能听懂自然语言指令，自主规划步骤、操控设备、执行多步骤复杂任务，还能自我纠错、完成全流程闭环，所以总的来说还是依赖于大模型。

原理

OpenClaw能稳定执行任务，核心主要是依赖四层解耦的架构设计，每层各司其职又联动配合。

架构分层	核心定位	核心功能
接入层（Gateway网关）	永远在线的指挥官	系统核心中枢，统一对接Telegram、飞书、企业微信、Discord等常用聊天工具，用户无需额外安装APP，在日常聊天窗口即可发指令；负责任务队列管理（默认串行执行，避免并发冲突）、消息路由与会话管理
大脑层（模型调度层）	思考决策中枢	本身不生产智能，而是灵活接入Claude、GPT系列、DeepSeek、通义千问甚至本地开源大模型，可按任务类型匹配最优模型；核心负责自然语言理解、任务拆解、逻辑推理、动作决策
执行层（Skills技能层）	动手干活的“钳子”	可扩展的功能插件体系，支持官方、社区贡献与用户自定义，支持热加载（新增技能无需重启服务）；通过操作系统底层API，实现文件管理、浏览器操控、办公自动化、代码编写、设备联动等具象操作，每个命令都在独立沙箱中运行，保障安全
记忆层（Memory系统）	可自主生长的记忆	本地存储对话历史、任务执行记录、用户偏好、技能参数等数据，完全在用户本地设备/服务器保存，不上传第三方；同时支持短期上下文记忆与长期习惯沉淀，越用越贴合用户需求

核心闭环

OpenClaw完成一个任务的核心逻辑，是业内经典的See-Think-Act-Feedback 感知-决策-执行-反馈循环，全程基本上无需用户全程干预，可自主完成多步骤复杂任务，当然bug菌觉得目前这也只是目标和口号了。

这里我们就以用户指令「帮我把Excel里的客户信息录入公司CRM后台，再给每个客户发通知邮件」为例，大致来看看这个小龙虾是怎么工作的：

步骤1：感知（See，AI的眼睛）

网关接收到用户的聊天指令后，转发给智能体核心；智能体先对电脑桌面截图，通过多模态大模型解析屏幕内容，识别Excel文件位置、CRM网页入口、邮箱客户端图标，同时读取Excel内的客户数据，明确任务边界与核心目标。

步骤2：决策（Think，AI的大脑）

大模型将复杂指令拆解为可落地的分步动作，同时设置校验规则与异常预案：

打开Excel文件，提取所有客户的姓名、联系方式、公司信息；
打开浏览器，进入CRM后台，自动完成登录；
逐行将客户信息录入CRM系统，核对关键字段匹配；
打开邮箱客户端，按模板给录入完成的客户发送通知邮件；
全部完成后，生成执行报告反馈给用户。同时可根据任务环节，自动切换适配的大模型，比如数据核对用逻辑能力强的Claude，邮件文案用创作能力强的GPT。

步骤3：执行（Act，AI的手/钳子）

智能体通过操作系统底层API，模拟人类的鼠标、键盘操作，严格按拆解的步骤执行：比如双击Excel图标打开文件、复制单元格内容、点击浏览器输入框粘贴网址、点击表单字段录入信息、点击发送按钮发邮件等。每个独立操作都在隔离沙箱中运行，避免误操作影响系统核心。

步骤4：反馈与纠错（Feedback，闭环核心）

每完成一个单步动作，智能体都会重新截图、读取系统状态，和预期结果比对：

若执行符合预期，进入下一个步骤；
若遇到弹窗广告、登录验证码、字段不匹配等异常，会自动识别问题，重新规划动作（比如关闭广告、请求用户提供验证码、调整字段映射），重试直到步骤完成；全部任务执行结束后，会把执行结果、成功/失败条目、异常情况整理成清晰的报告，通过聊天窗口反馈给用户。

这个循环会持续迭代，直到任务完全达成目标，哪怕中途出现意外，也能自主纠错，无需用户全程盯守。

特点

龙虾如此火爆其实得益于它有如下几点受用户喜爱的特性:

1、本地部署，隐私可控：所有数据和执行都在用户自己的电脑/服务器上完成，不会上传第三方服务器，用户完全掌控权限，极大降低数据泄露风险。

2、低门槛+高扩展：零基础用户最快10分钟即可完成部署，无需掌握编程技能，通过自然语言就能指挥；同时支持社区技能扩展，可直接复用他人开发的成熟技能包，也能自定义编写新技能，能力边界可无限拓展。

3、递归式技能进化：遇到未知任务时，它能自主编写代码、在本地沙箱调试、自我修正，最终把成功的执行流程封装成标准化的技能文件，相当于自主学会新能力，越用越强大。

4、默认安全的设计：默认采用串行执行任务，避免异步编程带来的竞态混乱；每个操作都在独立沙箱运行，限制权限范围，最大程度降低误操作和系统安全风险。

当然目前openclaw确实还存在着这样或者那样的问题，不过他的出现让用户逐步开始意识到从操作员向管理者看齐，不再受限于繁琐的点击和搬运工作，转而更加高层的决策和目标，相信随着技术的迭代将会带来更高的生产力。

------------ END ------------