来源 | 最后一个bug
1
小龙虾


2
原理
OpenClaw能稳定执行任务,核心主要是依赖四层解耦的架构设计,每层各司其职又联动配合。

|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
3
核心闭环
OpenClaw完成一个任务的核心逻辑,是业内经典的See-Think-Act-Feedback 感知-决策-执行-反馈循环,全程基本上无需用户全程干预,可自主完成多步骤复杂任务,当然bug菌觉得目前这也只是目标和口号了。

这里我们就以用户指令「帮我把Excel里的客户信息录入公司CRM后台,再给每个客户发通知邮件」为例,大致来看看这个小龙虾是怎么工作的:
步骤1:感知(See,AI的眼睛)
网关接收到用户的聊天指令后,转发给智能体核心;智能体先对电脑桌面截图,通过多模态大模型解析屏幕内容,识别Excel文件位置、CRM网页入口、邮箱客户端图标,同时读取Excel内的客户数据,明确任务边界与核心目标。
步骤2:决策(Think,AI的大脑)
大模型将复杂指令拆解为可落地的分步动作,同时设置校验规则与异常预案:
-
打开Excel文件,提取所有客户的姓名、联系方式、公司信息; -
打开浏览器,进入CRM后台,自动完成登录; -
逐行将客户信息录入CRM系统,核对关键字段匹配; -
打开邮箱客户端,按模板给录入完成的客户发送通知邮件; -
全部完成后,生成执行报告反馈给用户。 同时可根据任务环节,自动切换适配的大模型,比如数据核对用逻辑能力强的Claude,邮件文案用创作能力强的GPT。
步骤3:执行(Act,AI的手/钳子)
智能体通过操作系统底层API,模拟人类的鼠标、键盘操作,严格按拆解的步骤执行:比如双击Excel图标打开文件、复制单元格内容、点击浏览器输入框粘贴网址、点击表单字段录入信息、点击发送按钮发邮件等。每个独立操作都在隔离沙箱中运行,避免误操作影响系统核心。
步骤4:反馈与纠错(Feedback,闭环核心)
每完成一个单步动作,智能体都会重新截图、读取系统状态,和预期结果比对:
-
若执行符合预期,进入下一个步骤; -
若遇到弹窗广告、登录验证码、字段不匹配等异常,会自动识别问题,重新规划动作(比如关闭广告、请求用户提供验证码、调整字段映射),重试直到步骤完成; 全部任务执行结束后,会把执行结果、成功/失败条目、异常情况整理成清晰的报告,通过聊天窗口反馈给用户。
这个循环会持续迭代,直到任务完全达成目标,哪怕中途出现意外,也能自主纠错,无需用户全程盯守。
4
特点
龙虾如此火爆其实得益于它有如下几点受用户喜爱的特性:
1、本地部署,隐私可控:所有数据和执行都在用户自己的电脑/服务器上完成,不会上传第三方服务器,用户完全掌控权限,极大降低数据泄露风险。
2、低门槛+高扩展:零基础用户最快10分钟即可完成部署,无需掌握编程技能,通过自然语言就能指挥;同时支持社区技能扩展,可直接复用他人开发的成熟技能包,也能自定义编写新技能,能力边界可无限拓展。
3、递归式技能进化:遇到未知任务时,它能自主编写代码、在本地沙箱调试、自我修正,最终把成功的执行流程封装成标准化的技能文件,相当于自主学会新能力,越用越强大。

4、默认安全的设计:默认采用串行执行任务,避免异步编程带来的竞态混乱;每个操作都在独立沙箱运行,限制权限范围,最大程度降低误操作和系统安全风险。
当然目前openclaw确实还存在着这样或者那样的问题,不过他的出现让用户逐步开始意识到从操作员向管理者看齐,不再受限于繁琐的点击和搬运工作,转而更加高层的决策和目标,相信随着技术的迭代将会带来更高的生产力。
------------ END ------------