王小川的医疗 AI 新答案:用 PAPA 打通医疗的「最后一公里」

极客公园 2025-12-08 13:48
王小川的医疗 AI 新答案:用 PAPA 打通医疗的「最后一公里」图1
这是一条门槛最高、监管最严、落地最复杂的赛道,也是人类和 AI 都必须要走的赛道。

整理|Moonshot

编辑|靖宇
 

在开源模型全面崛起的这一年,医疗已经成为大模型比拼的主战场之一。OpenAI 抛出 HealthBench,试图建立统一评价体系,OpenEvidence 等 AI 医疗公司愈发受到资本青睐,大众对 AI 医疗的接受程度也在不断提升。

因为医疗牵动的是人类最本质的课题:生命科学。

在现实层面,日益增长的慢病管理需求、快速老龄化带来的系统压力、平均 73 天翻倍的医学知识量、都让传统医疗模式愈发吃紧。伴随式护理、个体化治疗、实时决策支持……这是每一位患者的需求,亦是每一位医生的压力。

在 IF 2026 的舞台上,王小川不仅展示了百川智能在医疗大模型领域的底层积累,更首次公开了其打通医疗全流程的最新解法——一套由「MAM 决策 AI」与「PAPA 陪伴 AI」构成的双轮驱动架构 。

如果说「MAM」(Medical Augmented Model)是坐镇院内的「外挂大脑」,依靠高可靠性的决策能力辅助医生「把病看准」;那么此次重磅首发的产品 AI PAPA(PlayBook Animated Proactive Agent),则致力于在院外接手,解决「把人管好」的难题。

相比于传统 AI 被动问答的模式,PAPA 带来了一次交互范式的革新。它基于独创的 PlayBook(行业 SOP)技术,将晦涩的临床指南转化为可执行的动态方案。它更像一位拥有长期记忆与多模态感知能力的家庭医生,能够以月甚至年为单位,从提醒用药到动态调整健康计划,主动追踪并管理患者的康复进程。这种「MAM 主内、PAPA 主外」的协同模式,标志着百川智能真正构建起了从严肃医疗诊疗到主动健康管理的完整闭环。

王小川的医疗 AI 新答案:用 PAPA 打通医疗的「最后一公里」图2

王小川在 IF 2026 舞台上|图源:极客公园

 

过去一年,百川智能在医疗领域的实践,也确实走出了行业少见的「从模型到Aengt系统、从技术到场景」的落地路径。

从与多家三甲医院联合验证临床可靠性,到让模型真正在专家会诊中心「上岗」;从辅助医生提升诊疗能力,到帮助一个个具体的病人,补齐医生都未掌握到的信息差……百川正在做的,是把大模型变成医院能用、医生敢用、患者愿意用的工具。

因此,这篇演讲更像是关于未来医疗形态的一次深度预演:当医学知识、临床路径、真实世界的健康数据在一个平台里被激活,它就不再只是 AI,而是一个新的医疗基础设施。

以下是百川智能创始人、CEO 王小川在极客公园创新大会 2026 上,关于医疗 AI 如何从理念走向落地,在真实世界中改变每一个人的健康决策的演讲实录,由极客公园整理:

嘉宾观点:

· 如果说财务自由意味着「不缺钱」,那么生命模型的终局则意味着「生物自由」,也就是不缺健康。

· 做医疗不仅是把模型应用到垂直场景,而是在回答:AGI 是否成立、如何成立,以及如何向前推进?

· 智力模型用来「造医生」,而当数据充足、范式改变后,我们有机会真正走向生命的数学模型。

· 我们认为做 AI 医生比做无人驾驶更靠谱,更刚需。

· 医疗中「人机协同」的速度,可能会超过无人驾驶的发展。

· 医学增强大模型既要有一线的通用能力,又要在医疗领域表现更佳。

· 我们的目标是让所有人都能即时获取可靠医学知识。

· 全球平均每 73 天医学知识就翻一倍,临床与前沿之间天然存在时间差。

· 过去我们做的是「医学增强大模型」,主要聚焦于决策 AI;而今天进入「陪伴」时代,我们构建的是完整的医疗 AI 平台。

· 大多数模型做的是单次任务,而我们做的是主动性的、长期的陪伴与管理。

 

极客公园创新大会的各位朋友,大家好。

今天我想和大家分享百川智能在医疗领域的一些思考与实践。从 GPT 诞生至今已经三年,我们正处在互联网的深度变革期,也亲眼见证人工智能在生活中的全面渗透。

百川是在 2023 年 4 月成立的,那时我写了一封公开信,分为两个部分。

第一部分讲的是我的技术认知:当语言被抽象为数学后,我们的思考、学习、沟通,乃至文化,都将成为数学问题。

第二部分谈的是使命与愿景,我提到在未来 20 年,希望能在生命科学与医学的发展中,以及公众健康领域,贡献自己的力量。

因此,百川一方面拥抱 AI 技术的演进,另一方面坚定地投入医疗与医学的未来。

王小川的医疗 AI 新答案:用 PAPA 打通医疗的「最后一公里」图3

图源:极客公园

 

01

生命模型带来的「生物自由」

 

在我的世界观里,如今的模型体系可以分为三类:

第一类是发展最快的「智力模型」,以语言为入口,对人类智力进行数学化;

第二类是「物理模型」,从牛顿以来用公式建构物理世界的方式延续至今,逐渐进入带有量子、核聚变等复杂因素的时代;它帮助我们造工具,而不是造智力;

第三类则是「生命模型」,以 Alpha 系列为代表,用数学方式理解基因、蛋白质及生命过程的预测机制。

基于此,我们今年提出了更明确的使命:为人类造医生,为生命建模型。这两件事一横一纵:智力模型用来「造医生」,而当数据充足、范式改变后,我们有机会真正走向生命的数学模型。

如果说财务自由意味着「不缺钱」,那么生命模型的终局则意味着「生物自由」,也就是不缺健康。

医疗是高度垂直的领域,我认为想把「医生」这件事做到极致,必须发展通用模型。

图灵曾提出:能与人类自然对话的机器就算智能。而在我看来,如果我们能造出一个像医生一样思考、判断、决策的 AI,那它在智力层面就已经达到 AGI;如果它能进一步完成手术和实际操作,则在具身层面也达到了 AGI;如果它能持续自主做科研,那它还具备了自我进化能力。

因此,做医疗不仅是把模型应用到垂直场景,而是在回答:AGI 是否成立、如何成立,以及如何向前推进?

回到现实,行业里仍有许多质疑,例如:AI 如何学习医学认知?是否具备同理心?伦理上能否上岗?我们早期的训练范式基于医院中的高质量病例,但医学更多依赖「生理信号」,比如 CT 片和 X 光。

但医生不只是读片子,更多是用强化学习去模拟出一个病人,所以如果 AI 想像医生一样成长,就需要一个「患者模拟器」,能够在强化学习中反复对照与校验。这是整个范式的基础。

至于同理心,行业里有统计:在某些测试中,GPT 的「同理心得分」大约是 45%,并且在以后会变得更有同理心,更懂情绪。而真人医生只有 4.6%。虽然这个数字仍有争议,但至少说明:机器不是不能具备「人味」。

如今大家都在做无人驾驶,无人驾驶也跟生命高度相关,我们认为做 AI 医生比做无人驾驶更靠谱,更刚需。因为没有无人驾驶,大家依然能开车;但没有医生为你看病,你自己没有诊断能力。

无人驾驶最大的挑战叫「接管」,即机器搞不定时必须由人类接手。而医疗恰恰相反,AI 与医生可以形成天然分工,AI 做大量辅助判断,医生做最后把关。因此医疗中「人机协同」的速度,可能会超过无人驾驶的发展。

今年以来医疗 AI 也出现了重要进展。

第一个典型案例是在今年初,患者开始带着 DeepSeek 去看病了。与过去医生不信 AI 的态度不同,现在,医生认可了 AI 在推理上的价值,甚至私下开始用 DeepSeek 和豆包查询。

第二个案例是,OpenAI 也在今年 5 月发布了 HealthBench,这是由全球 60 国、262 位医生构建的首个「临床问题」级别的评测集,为行业定下标准,也意味着 OpenAI 开始认为医疗是 AI 发展的一个重大方向。

同期,有一家诞生于 2023 年,异军突起的公司 OpenEvidence,在八月以 60 亿美金开始新一轮融资,它已经不只是帮医生做语音转写病例,而是做「辅助决策」,目前美国已有 40% 的医生注册使用。这说明全球医生正在拥抱 AI,顶级公司也把医疗视为战略方向。

医疗相关话题的人工智能搜索量,也在今年爆发性增长。在 DeepSeek 和豆包上,约 20% 的检索已经和健康相关,百度此前这一比例是 10%。

 

02

医疗增强大模型该怎么做

 

在我们的路线图里,AI 首先要帮助我们「造出一个医生」:它能替代或承担那些医生做不到、或者不愿去做的工作。

更重要的还有两个愿景:其一是「改路径」,这在明年就有可能开始显现,即让医疗行为不再仅仅限定在医院内部。很多人觉得医院体系难以改造,我也认同这点,所以我们的设想是,AI 的应用场景除了在医院做辅助判断之外,还能够大量下沉到居家和院外场景。

其二是一旦 AI 医生能够上岗,它就能长期陪伴个体,持续监测你的健康数据。从抽烟、喝酒到药物反应、疾病进展,在关键数据出现时,推动临床实践产生新的范式,不再把医学仅视为离散的点状决策,而是形成连续的、可学习的临床循环。

实现这一目标的第一步,是让 AI 在决策上做到优于甚至超越人类医生,成为医生的「外挂大脑」。

医学增强大模型既要有一线的通用能力,又要在医疗领域表现更佳。

我们常把知识分为文、理、医、工、艺五大类:文科以语言为主、理科以数学为主、工科以代码为主、艺科以图像与视频为主,那么医学的训练范式到底应该是什么?

目前的核心任务可以归为三件事:第一,如何做出更精准、更接近临床思维的医学推理——这是诊断与决策的核心,我们已经引入临床医生参与验证与闭环;

第二,如何确保安全可信。模型会出现「幻觉」,我们要大幅降低幻觉率,并让模型具备「知其所不知」的能力;

第三,如何实现循证决策。医生不能单凭经验行医,必须依托循证医学,把零散的论文、指南、荟萃分析等证据进行规范化、统计化和等级化处理。

为此,我们一方面用大量高质量医学文献训练模型,另一方面构建「患者模拟器」用于强化学习的闭环验证,文献与模拟患者两者并重,构成训练体系的基础。

王小川的医疗 AI 新答案:用 PAPA 打通医疗的「最后一公里」图4

参考培养人类医生的路径去训练大模型|图源:极客公园

 

在这一系列范式下,我们从去年 8 月与儿童医院合作开始,到今年 1 月发布 M1 模型,AI 医生已经在北京儿童医院专家会诊中心「上岗」,成为国内甚至全球第一个真正「上岗」的 AI 医生。

随着团队专注度的提升,今年 8 月,我们正式推出了 M2 模型。彼时正值 OpenAI 宣布其开源模型在医疗领域「全球第一」。一周后,M2 在 OpenAI 自己提出的 HealthBench 测试中,开源模型里排名第一,闭源模型里只落在 GPT-5 之后。

OpenAI 曾强调全球只有它的模型在 HealthBench-Hard 模式下超过 32 分,而我们成为唯一同样跨过 32 分线的第二家引擎。

10 月,我们进一步发布 M2 Plus,让模型在六源循证的数据总结和论文学习方面有更强表现。整体幻觉率只有 DeepSeek 的三分之一,在医学知识运用上也全面追平甚至超越了 DeepSeek、GPT,以及美国的 OpenEvidence 引擎。

基于这套底层引擎,我们在 10 月同步推出了新版「百小应」,目标是让所有人都能即时获取可靠医学知识。现阶段我们优先开放给医生,希望医生成为第一批深度使用者,因为他们更有能力判断信息、反哺模型。

举个简单例子:今天在小红书搜索「维生素 D 是否能治疗癌症」,各种模糊、夸大的结论铺天盖地。但与百小应对话,它能在数秒内基于可靠证据链给出结论:补充维生素 D 能降低癌症风险尚无明确临床共识,现有证据显示其效果有限且存在争议,并能进一步附上对应的顶尖论文。其他模型常常给不出明确答案,给出的只是一些「似是而非」的模糊判断。

王小川的医疗 AI 新答案:用 PAPA 打通医疗的「最后一公里」图5

如今从「百度看病」流行到「小红书看病」|图源:极客公园

 

模型上线以来,不仅有医生在用,甚至有高认知的患者也在用。我们注意到一位用户单轮对话超过 300 次,主动联系后得知他是北京的朱先生,58 岁,之前做过医疗创业,有很强的医学背景,5 年前因甲状腺癌做过手术。

他向我们展示的第一句话很震撼:他感谢百小应告诉他「优甲乐需要减量」,这是指南里写得很清楚、但某三甲医院的医生却没有提醒的关键信息。因为没有按指南减量,他多年深受甲减亚健康困扰,在体重、睡眠各方面都出现了问题。随后他带着模型生成的资料回到三甲医院与医生沟通,对方才意识到 2022 年指南已更新。

这是一个非常典型的「医学知识更新速度远超临床实践」的现实案例。全球平均每 73 天医学知识就翻一倍,临床与前沿之间天然存在时间差。

在这些实践的推动下,我们开始构建「陪伴 AI」。

 

03

PAPA:主动陪伴患者的医疗 Agent 平台

 

创业之初我们想做院外医疗,如今我们把它定义为 决策 AI + 陪伴 AI 的双系统结构。其中陪伴 AI 的核心能力是主动:它不再只是「有问才有答」,而是能提问、分解问题、规划健康路径,从被动回答进化为长期健康管理代理(Proactive Agent)。

我们现在能做到让模型主动规划和关心你的健康,包括医嘱服从,提醒你什么时候该吃药、就诊。当你说身体不适,它会建议你去体检,并在下周主动追问你是否完成;当你吃了布洛芬,它会在两小时后询问退烧情况并追踪病程;甚至接入可穿戴设备后,它能根据生理指标异常主动介入做干预。

王小川的医疗 AI 新答案:用 PAPA 打通医疗的「最后一公里」图6

百川智能想做更主动的 AI 医生|图源:极客公园

 

这件事情说起来简单,做起来很复杂。

以孕产期糖尿病为例,我们已经让 AI 系统根据指南完成全程健康规划:胰岛素调节、饮食管理、产检计划等均可自动执行,实现真正意义上的「主动健康」。

我们现在的底层架构,是一个多任务调度系统。此前我们构建了一套 PlayBook 专家范式,实现了医学知识生产的「产业分离」。

产品经理和医学专家可以共同撰写管理规范,包括临床路径、决策方式、沟通方式,以及中间记忆的设计。针对不同疾病与专科,例如孕产、肿瘤、全科、儿科等,各类指南都可以写入 PlayBook。

系统会根据这些内容自动外显成一名「专科医生」。我们把这种具象化能力称为 PlayBook Animated:当你给它一本操作手册或战术手册,它就会「活过来」,变成一个会思考、会对话、能记忆的医生。同时,它还能接入个人的长期健康数据,包括内置的个人档案以及来自可穿戴设备的生理信息。

这也标志着我们范式的重大变化:过去我们做的是「医学增强大模型」,主要聚焦于决策的 AI;而今天进入「陪伴」时代,我们构建的是完整的医疗 AI 平台。PlayBook Animated Proactive Agent(PAPA)就是基于这个理念打造的。

当增强模型与 PAPA 平台结合,我们认为是一种「双剑合体」:一个负责「训模练内力」,一个负责「招式与实战」。两者结合,我们在医学领域才能真正向前推进一大步。

与当前市场上的模型相比,PAPA 最大的不同是:大多数模型做的是单次任务,而我们做的是主动性的、长期的陪伴与管理。它不是靠一套 prompt 运行,而是根据多个专业 PlayBook 生成多种范式,支持以「月」为单位、甚至以「年」为单位地持续工作,主动进行干预,同时在背后保留完整的个人健康档案与长期多模态数据。

PAPA 更像一个医疗操作系统:在应用层把 PlayBook 转码成长期规划与解释执行能力;在能力层运行疾病预测模型、工具调用系统;在数据层存储聊天记录、时间序列数据库,并连接外部环境。同时它还具备自我调试与开发环境:当出现 bug 时,系统能够自动分析并迭代自己的执行方式。

当你提出一个问题时,系统会自动根据 PlayBook 触发整套流程:判断、搜索、聚合、输出;你继续追问,它会继续调用 PlayBook、选择技能、给出解释。无论是流行病相关药品查询,还是证据链核验,它都会生成结果并进行安全校验,校验不通过会自动回滚,确保输出是可信的。

王小川的医疗 AI 新答案:用 PAPA 打通医疗的「最后一公里」图7

扫码体验 PAPA Playground|图源:极客公园

 

系统不仅支持文字,也支持语音、图像、地理位置等多模态交互。比如我们演示的试剂盒检测,PAPA 会自动要求你做两次测试;背后我们有独立的多模态模型识别红线,并达到极高精度。这是现有专业模型和通用模型普遍难以做到的深度多模态处理能力。

服药之后,系统会生成后续规划、任务提醒,更新健康档案,再过一段时间提醒你复测,并解释数值变化。包括像「中午记得吃药」这样的提醒,它都会自动触发并执行。

如果有医学行业的朋友希望开发自己的 PlayBook,系统内也提供了合作方式,可以一起把这套体系打磨得更专业。除了 PAPA 平台,我们也开放底层引擎 API,欢迎大家使用我们的「百小应」。

今天就介绍到这里,谢谢大家。

*头图来源:极客公园

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI 医疗
more
【学术交流周】专题4:计量创新驱动核医疗产业高质量发展新格局研讨会暨四川省医学计量技术委员会年会在成都成功召开
手术机器人年增40%!500亿医疗电子市场谁在领跑?
医疗健康智能设备应用及技术服务全球能力提升项目可行性研究报告
医保支付改革与脑机接口:国家资本如何撬动普惠医疗未来?
特朗普“降药价”新政下,中国药企谁是赢家?
学会动态丨为“人工智能+医疗”把脉开方,2025CAAI具身智能与智慧医疗前沿论坛在广州成功举办
芯明与华西医院达成战略合作 共绘医疗空间智能新蓝图
【智合·政策速览】四川省经济和信息化厅组织开展2025年高端医疗装备推广应用项目申报工作
让智能体「规模化」设计新型抗体分子,「寻明生科」获数千万美元A轮融资丨早起看早期
《采用脑机接口技术的医疗器械 RACA机器人运动意图编解码性能测试方法》医疗器械行业标准制修订项目正式立项
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号