火爆的OpenClaw小龙虾到底干啥的?

strongerHuang 2026-03-08 10:10

来源 | 最后一个bug

 

最近科技界最火的莫过于OpenClaw,相信只要你或多或少也听说过,今天就来聊聊这个AI智能体OpenClaw。

OpenClaw,大家都叫他小龙虾,安装这个智能体的过程就叫"养虾"。

1

小龙虾

火爆的OpenClaw小龙虾到底干啥的?图1
它是由奥地利程序员Peter Steinberger开发,核心slogan是“the AI that actually does things”(真正能干活的AI)。它因红色龙虾Logo、核心是用“钳子(claw)”执行操作、迭代逻辑对应龙虾蜕壳生长,所以大家才叫它“小龙虾”,也是GitHub历史上增速最快的开源项目之一,4个月星标突破25万+,说是已经超过了linux等长周期开源项目。
大伙都知道现在的ChatGPT等大模型只负责“出方案、给答案”,然而OpenClaw它也不是什么更加厉害的大模型,他只是给大模型装上了“眼睛、大脑、手和记忆”,能听懂自然语言指令,自主规划步骤、操控设备、执行多步骤复杂任务,还能自我纠错、完成全流程闭环,所以总的来说还是依赖于大模型。
火爆的OpenClaw小龙虾到底干啥的?图2
 

2

原理

OpenClaw能稳定执行任务,核心主要是依赖四层解耦的架构设计,每层各司其职又联动配合。

火爆的OpenClaw小龙虾到底干啥的?图3
架构分层
核心定位
核心功能
接入层(Gateway网关)
永远在线的指挥官
系统核心中枢,统一对接Telegram、飞书、企业微信、Discord等常用聊天工具,用户无需额外安装APP,在日常聊天窗口即可发指令;负责任务队列管理(默认串行执行,避免并发冲突)、消息路由与会话管理
大脑层(模型调度层)
思考决策中枢
本身不生产智能,而是灵活接入Claude、GPT系列、DeepSeek、通义千问甚至本地开源大模型,可按任务类型匹配最优模型;核心负责自然语言理解、任务拆解、逻辑推理、动作决策
执行层(Skills技能层)
动手干活的“钳子”
可扩展的功能插件体系,支持官方、社区贡献与用户自定义,支持热加载(新增技能无需重启服务);通过操作系统底层API,实现文件管理、浏览器操控、办公自动化、代码编写、设备联动等具象操作,每个命令都在独立沙箱中运行,保障安全
记忆层(Memory系统)
可自主生长的记忆
本地存储对话历史、任务执行记录、用户偏好、技能参数等数据,完全在用户本地设备/服务器保存,不上传第三方;同时支持短期上下文记忆与长期习惯沉淀,越用越贴合用户需求

3

核心闭环

OpenClaw完成一个任务的核心逻辑,是业内经典的See-Think-Act-Feedback 感知-决策-执行-反馈循环,全程基本上无需用户全程干预,可自主完成多步骤复杂任务,当然bug菌觉得目前这也只是目标和口号了。

火爆的OpenClaw小龙虾到底干啥的?图4

这里我们就以用户指令「帮我把Excel里的客户信息录入公司CRM后台,再给每个客户发通知邮件」为例,大致来看看这个小龙虾是怎么工作的:

步骤1:感知(See,AI的眼睛)

网关接收到用户的聊天指令后,转发给智能体核心;智能体先对电脑桌面截图,通过多模态大模型解析屏幕内容,识别Excel文件位置、CRM网页入口、邮箱客户端图标,同时读取Excel内的客户数据,明确任务边界与核心目标。

步骤2:决策(Think,AI的大脑)

大模型将复杂指令拆解为可落地的分步动作,同时设置校验规则与异常预案:

  1. 打开Excel文件,提取所有客户的姓名、联系方式、公司信息;
  2. 打开浏览器,进入CRM后台,自动完成登录;
  3. 逐行将客户信息录入CRM系统,核对关键字段匹配;
  4. 打开邮箱客户端,按模板给录入完成的客户发送通知邮件;
  5. 全部完成后,生成执行报告反馈给用户。 同时可根据任务环节,自动切换适配的大模型,比如数据核对用逻辑能力强的Claude,邮件文案用创作能力强的GPT。

步骤3:执行(Act,AI的手/钳子)

智能体通过操作系统底层API,模拟人类的鼠标、键盘操作,严格按拆解的步骤执行:比如双击Excel图标打开文件、复制单元格内容、点击浏览器输入框粘贴网址、点击表单字段录入信息、点击发送按钮发邮件等。每个独立操作都在隔离沙箱中运行,避免误操作影响系统核心。

步骤4:反馈与纠错(Feedback,闭环核心)

每完成一个单步动作,智能体都会重新截图、读取系统状态,和预期结果比对:

这个循环会持续迭代,直到任务完全达成目标,哪怕中途出现意外,也能自主纠错,无需用户全程盯守。

4

特点

龙虾如此火爆其实得益于它有如下几点受用户喜爱的特性:

1、本地部署,隐私可控:所有数据和执行都在用户自己的电脑/服务器上完成,不会上传第三方服务器,用户完全掌控权限,极大降低数据泄露风险。

2、低门槛+高扩展:零基础用户最快10分钟即可完成部署,无需掌握编程技能,通过自然语言就能指挥;同时支持社区技能扩展,可直接复用他人开发的成熟技能包,也能自定义编写新技能,能力边界可无限拓展。

3、递归式技能进化:遇到未知任务时,它能自主编写代码、在本地沙箱调试、自我修正,最终把成功的执行流程封装成标准化的技能文件,相当于自主学会新能力,越用越强大。

火爆的OpenClaw小龙虾到底干啥的?图5

4、默认安全的设计:默认采用串行执行任务,避免异步编程带来的竞态混乱;每个操作都在独立沙箱运行,限制权限范围,最大程度降低误操作和系统安全风险。

当然目前openclaw确实还存在着这样或者那样的问题,不过他的出现让用户逐步开始意识到从操作员向管理者看齐,不再受限于繁琐的点击和搬运工作,转而更加高层的决策和目标,相信随着技术的迭代将会带来更高的生产力。

------------ END ------------

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
more
人民日报关注:成都的工业机器人,从“听话”到可自主决策
Rivian旗下工业机器人公司Mind Robotics完成5亿美元A轮融资,估值达20亿美元
灿瑞科技全球芯片研发中心主体封顶,打造普陀“工业上楼”标杆
德州仪器 Sitara 产品系列赋能工业网络升级,引领更智能的工业互联
国产工业机器人龙头新动态:净亏损预扩大186%、筹划收购、调整产品价格
贝索斯拟募资千亿美元打造工业AI控股平台,聚焦航空航天与芯片等领域
舍弗勒×乐聚机器人:中德“双buff”,落子工业具身智能规模化商用
国内首个!360发布“纳米漫剧流水线”,AI漫剧生成进入工业化时代
1376亿,全球巨头,中国工业传感器第一股诞生!
越疆第三批全尺寸工业人形机器人量产交付,朝着更深、更实的产业应用推进
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号