雇佣过目即忘的天才:为什么企业级AI总在浪费钱?

甲子光年 2025-12-04 21:06

让AI从“临时工”进化为“老员工”。

 

作者|田思奇

编辑|栗子

 

智能,并非由算力堆砌而来。

 

无论是人类大脑还是硅基系统,维持稳定判断的前提只有一个:记住过去,才能读懂现在。没有记忆,再聪明的推理也只能停留在临场反应。

 

在克里斯托弗·诺兰的电影《记忆碎片》中,主角拥有完整的旧记忆,但在一场意外后无法形成新的长期记忆,他只能依靠拍立得和纹身保持与世界的连接。今天的AI Agent也是如此:学习过静态知识库,可以执行任务;但却缺乏连续性,动态数据割裂。

 

行业的主流解法是给大模型外挂RAG(检索增强生成),但这更像是给健忘的人配了一本字典。它解决的是“查阅”问题,而非“认知”问题。

 

成立于2024年的红熊AI给出了新解法:智能不取决于你知道多少,而取决于你记住了什么。其核心产品“记忆熊”(Memory Bear)近日宣布开源。这一整套记忆系统结合Agent平台,让企业真正拥有了“长期记忆的AI员工”。

 

“我们不是在造神,而是在造帮人类解决问题的工具。”红熊AI创始人兼CEO、记忆熊首席科学家温德亮对「甲子光年」表示。

 

在模型能力日益趋同的今天,AI正从算力之争,走向记忆之争。

 

雇佣过目即忘的天才:为什么企业级AI总在浪费钱?| 甲子光年图3

 

1. 做了RAG,业务还是上不去

雇佣过目即忘的天才:为什么企业级AI总在浪费钱?| 甲子光年图4

 

想象一下:你花重金挖来一位智商超群的CXO。他博闻强识,反应敏捷,但有个致命缺陷:记忆如同金鱼般短暂。上午处理过的投诉,下午忘得一干二净;换个办公室,不认识老客户了。

 

听起来荒诞,却是当下企业部署AI的现实。模型的回答足够聪明,但业务准确度支离破碎。为了唤醒这位“健忘的天才”,企业被迫花费大量token重新训练,支付着昂贵的“记忆税”。

 

这意味着什么呢?意味着客服不知道销售的承诺,销售不知道售后的进度。同一位用户不得不向AI重复3遍问题,导致负面情绪堆积。

 

这种割裂同样发生在模型之间:多个Agent各自独立形成数据孤岛,无法共享上下文记忆,协作效率极低。

 

深入AI客服业务时,温德亮对此深有体会。他发现无论模型参数多大,推理性能再优秀,业务回答的准确率始终卡在瓶颈期,无法满足B端严苛的交付标准。

 

“为了解决这个问题,我们最初尝试过行业许多标准解法:外挂RAG或拉长上下文窗口、训练模型、优化参数等等。”温德亮向「甲子光年」回忆。但现实给了团队一记闷棍:这些方案本质上是“黑盒”。企业把文档塞进去,却无法控制系统记住了什么、遗忘了什么。

 

结果是,系统变成了只进不出的“信息垃圾桶”,模型幻觉频发。就像老师把整本书丢给学生,却不告诉他哪些是考点。

 

失败的尝试,让温德亮意识到:企业需要的不是一个更厚的笔记本。要想让AI从工具变成能协作的智能体,必须让历史真正影响未来,而不是仅仅被检索到。

 

这成为了红熊AI诞生的原点——放弃修补,彻底重构,打造一套透明可控的记忆操作系统,完全围绕实际业务需求进行记忆的结构化处理,让AI可以如同人类一样产生灵活的记忆能力。

 

在温德亮看来,若不进行结构化,AI无法有效调用信息,更无法进行逻辑校验。他举了一个生动的例子:“‘巴黎是法国首都’是常识。但若有人多次误导AI说‘巴黎不是’,传统模型极易受‘近因效应’干扰产生错误认知。”

 

红熊的系统则不同,它通过规则验证机制甄别矛盾信息,拒绝写入错误认知。这种能力让AI拥有了“批判性思维”,不再是人云亦云的复读机。

 

自2024年11月立项以来,红熊AI在荒原上依靠商业化验证摸索,试图将人类记忆的核心动作——编码、存储、校准全部做成标准化的工程系统。

 

对于企业而言,模型可以被替代,但经验不能;算法可以共享,但记忆沉淀无法复制。当所有的竞争对手都用上同样的模型时,唯一的护城河,是企业拥有的私有记忆资产。

 

真正的智能差异,将由记忆沉淀拉开。

 

2. 如何构建可进化的记忆层架构?

雇佣过目即忘的天才:为什么企业级AI总在浪费钱?| 甲子光年图5

 

拒绝做简单外挂缓存的记忆熊,主要致力于在工程层面复现人类记忆的复杂机制,通过逻辑联想、隐性感知、语境校准、智能遗忘等步骤,构建了完整的记忆闭环。

 

重构始于对连接方式的质疑。在目前的AI技术栈中,向量数据库几乎是标配。虽然它处理简单问答效率极高,但其“相似度匹配”的原理本质上还是查字典,缺乏生物大脑触类旁通的弹性。

 

为了突破这一局限,记忆熊构建了基于动态图谱的逻辑联想机制

 

这就像人类听到“咖啡”,下意识联想到的不仅是饮料,还有早晨、通勤和提神。在传统AI眼中,“会开车”只是孤立标签;在新架构下,它被标记为需要长期固化的技能。这种从机械匹配到动态语义网络的跨越,让AI拥有了类似人类的联想本能。

 

逻辑推理只是起点,更深层的挑战在于捕捉“不可言说”的潜台词。旧系统只能记住用户“说了什么”,却忽略了“没说什么”。

 

为此,记忆熊引入了独立的隐性记忆引擎。当用户抱怨“冷”时,传统模型等待指令,而该引擎会联动室温与季节背景,自动推荐围巾。甚至当一位用户再次接入服务时,记忆熊回忆起的不仅是上次的投诉内容,还有当时他愤怒的情绪值以及随后的平静过程。从此,AI不再是冷冰冰的逻辑机器,而是开始进化为具备共情能力的伙伴。

 

然而,屏幕里的算法可能是完美的,现实中的数据是杂乱的。用户的表达往往碎片化甚至前后矛盾。

 

为了在混乱中建立秩序,记忆熊开发了动态语境校准和和记忆质量评估。如果用户上午说“要红色”,下午改口“还是喜欢蓝的”,传统的线性存储会导致决策分裂。而记忆熊引入了类似人类常识的判断机制,结合时间戳识别出这是一次“意图修正”,自动用新需求覆盖旧记忆。实测数据显示,这种机制将因信息冲突导致的语境偏移率降低82%。

 

对人类认知的极致模仿,不仅体现在“如何记住”,更体现在“如何遗忘”上。在以token计费的时代,盲目追求“记住所有事”是对算力的极大浪费。

 

为此,记忆熊引入记忆萃取引擎。执行的是高精度的“物理剪枝”:实时剥离对话中的寒暄与废话,只保留关键信息点。更高的技术壁垒还在于自我反思引擎。它模拟了人类深度的反思过程——就像人脑在入睡后会梳理经历、修正认知一样,该引擎能在时间维度,事实维度,逻辑维度对知识图谱深度优化,将碎片化的瞬时记忆,蒸馏为结构化的工作记忆。

 

同时,记忆熊独有的记忆遗忘引擎,也通过数学驱动的记忆激活度,而非死规则,管理长期记忆衰减与强化。

 

“我们遵循艾宾浩斯遗忘曲线。AI不该记住所有事,对于用户无意识的行为或无需留存的信息,系统会自动判定为无需记忆。这是对算力的节省,也是对人性的尊重。”温德亮指出。

 

这种基于场景感知的语义权重计算,让成本压缩为1/24。企业不再需要为海量的废话买单,AI的反应速度也因为负担减轻而变得更加敏捷。

 

雇佣过目即忘的天才:为什么企业级AI总在浪费钱?| 甲子光年图6

 

当个体记忆被精准管理后,红熊通过自研的Red Bear Swarm框架,将记忆层独立为所有智能体通用的“中央大脑”。针对销售AI与风控AI可能出现的决策冲突,系统确立了“明确决策主体”的规则,解决了多智能体“打架”的问题,让AI团队协作成为可能。

 

在LOCOMO数据集测试中,记忆熊单跳问答、多跳推理、开放泛化和时序处理四大核心任务中,其关键指标均超越MemO、Zep、LangMem等现有主流方案,实现97%的token效率提升和82%的语境偏移率降低,扭转了传统记忆系统“高消耗、低准确”的困境。

 

在技术的演进中,红熊始终保持着对伦理的审视。

 

“人类的道德本质上源于记忆。”温德亮强调。记忆熊可区分显性和隐性记忆,其核心逻辑不是“该如何记”,而是尊重“该如何做”,满足个性化隐私需求。

 

为了消除企业对“黑盒”的顾虑,记忆熊用户也可实时查看对话如何被存储或遗忘,配合严格的审核机制,确保敏感信息有效隔离。

 

当这项技术走出实验室,真正的价值才刚刚开始。

 

3. 消除情绪断层,AI服务的最后一公里

雇佣过目即忘的天才:为什么企业级AI总在浪费钱?| 甲子光年图7

 

记忆熊的核心任务,并非仅仅是提升每一次问答的准确率。它需要从这些断裂的业务流中,重建一种稀缺的资源——时间的连续性。

 

先看零售与客服领域,这里是企业AI“记忆税”最重的地方。过去,客服轮岗导致用户被迫重复陈述,负面情绪层层叠加。接入记忆熊后,体验被彻底重构:当一位因物流延误而愤怒的用户下午再次接入,AI不再机械问候,而是直接延续上午的对话:“您好,关于您反馈的异常,已加急处理,目前状态是……”

 

AI继承了上一次的情绪脉络与任务进度,服务未因时间切断而断层。在实际案例中,这种拥有“资深导购”记忆的接待能力,将人工替代率推高至70%。解决问题本身,就是最好的情绪抚慰。

 

在更复杂的场景中,用户需求不是静态的点,而是一条动态流淌的线。传统AI捕捉孤立关键词,红熊则理解线条走向。

 

以电商为例,系统能理解用户的兴趣迁移。它能捕捉到新手父母的需求从新生儿睡袋到辅食机的演变,提供具备上下文的建议。AI不再仅仅是推销商品,而是理解并陪伴一个家庭的生命周期。

 

在医疗领域,记忆价值在于辅助决策。传统的问诊AI每次都在重新“查户口”,而红熊系统能调用历史病程辅助判断。在影像诊断中,通过关联对比当前与历史影像,系统能精准识别病变的演进情况。这种基于时间维度的纵向对比,比单次诊断更具临床价值。

 

同样的逻辑延伸至教育。红熊摒弃了竞品的“题海战术”,转而记录学生的认知轨迹。区分已掌握与未掌握的知识点,像经验丰富的老师画重点一样,让学生只学该学的,大幅提升效率。

 

在营销端,记忆功能解决了企业最头疼的“盲目投放”问题。当企业没有现成客户画像时,系统可基于开发者的记忆——即对目标客户的定位作为初始画像,在茫茫人海中精准捕获潜在客户。而通过记忆大量客户的共同特征,系统能自动提炼出核心关注点并进行二次强化。

 

无论是零售、医疗还是教育,这些看似风马牛不相及的场景,都在被同样的痛点折磨:遗忘、割裂和重复劳动。

 

红熊AI所做的,不仅是让回答更准确,更让AI从即用即弃的问答机器,升级为可持续的智能服务体系。商业交互不再是零和博弈,而是一段段累积信任的关系。

 

4. 从记忆到认知,软件硬件化

雇佣过目即忘的天才:为什么企业级AI总在浪费钱?| 甲子光年图8

 

随着推理能力快速普及,企业之间真正拉开差距的,是系统是否具备可复用的长期经验。

 

刚过去的11月,谷歌新发的论文《Nested Learning: The Illusion of Deep Learning Architectures》验证了这一方向:单纯卷参数的时代结束了,解决记忆灾难是通往AGI的必经之路。

 

但谷歌需要重构模型的神经网络架构,乃至下一代芯片的配合。这是漫长的“远水”,而企业正面临连续服务断层的“近火”,必须尽快解决AI客服记不住客户名字的问题,打通销售与售后的数据孤岛。

 

这正是红熊AI的战略卡位所在。相比于谷歌的宏大愿景,红熊选择用工程手段,直接为企业装配安全可控的、即插即用的“工业级海马体”。

 

温德亮对「甲子光年」坦言,他低估了2025年AI应用市场的爆发力。以往企业对AI多持观望态度,现在AI应用正在从边缘走向核心,改变传统软件的应用逻辑。

 

在此背景下,红熊的野心不止于做一家卖Agent平台的公司。

 

此次开源发布,红熊提供的不仅是一个记忆层协议,更是一套可落地的Agent运行环境,包括记忆系统、任务编排、工具调用、多模态输入、权限体系。换句话说,不仅能接入记忆,也能直接用这套系统构建、部署和运营自己的AI员工。

 

当所有的智能体都遵循同一套记忆标准时,信息壁垒将被彻底打破,记忆将连接万物。但在温德亮看来,记忆只是起点,红熊AI最终追求的是从记忆到认知的质变

 

“传统机器人递水需要拆解为30个机械步骤。而在认知智能模式下,这一过程被简化为三步:看到水、判断主人渴了、递过去。”温德亮指出,“因为有了‘认知’,系统不再是机械执行指令,而是理解了行为背后的意义。”

 

这种认知突破,终将从软件走向硬件。

 

展望未来5到10年,温德亮相信,人机共存将成为社会主流形态,红熊AI也将同步推动记忆科学的“芯片化”,实现“软件硬件化”的终极形态。

 

“我们的核心目标是让机器人实现‘换芯即换人格’,”温德亮描绘了这样一个未来,“未来的机器人,本地化记忆存储在芯片中。无需复杂的后台调试,插上这块芯片,它就拥有了特定的性格、习惯和技能。”

 

从技术趋势来看,这一天并不遥远。认知智能的市场接受度或许在明年就会迎来突破。而红熊AI正在做的,就是为这个即将到来的智慧时代,铺设最底层的认知铁轨。

(封面图来源:电影《记忆碎片》剧照。文中图片来源:红熊AI)

 

END.

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI
more
知名数学家辞职投身AI创业:老板是00后华人女生
不只理想夸克,我们还有7家大厂AI眼镜的独家消息
DeepSeek的小更新,暴打了OpenAI,追上了Gemini。
李飞飞炮轰 AI 圈两大乱象:要么贩卖恐慌,要么画饼充饥,都是误导大众
AI竞赛升级,OpenAI正积极应对谷歌追赶势头
首发即爆单!华为AI玩具火出圈,千亿市场芯片厂商加速入局
抖音李亮:豆包手机助手不存在「入侵」「越权」等行为;理想发布首款AI眼镜:1999元起,能远程控车、听歌;安克创新冲击港股IPO
首款豆包AI手机售罄:二手价最高超万元,租赁单日报价600 元
一句话生成应用!灵光AI已被网友玩疯,两周狂产330万
AI for Science,走到哪一步了?
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号