【科技纵览】1月13日下午,在清华科技园赛迪大厦一间朴素会议室里,久未公开露面的百川智能创始人王小川与模型技术负责人鞠强共同出席了一场小范围媒体沟通会。没有繁复流程,二人直接切入主题:百川新一代医疗大模型Baichuan-M3已攻克长期困扰行业的“幻觉”难题,正式具备面向严肃医疗场景的能力。
“2024年你跟医生聊AI,没人信;但到了2025年,大家发现它确实比百度靠谱太多。”王小川坦言,“过去医生会说‘你要信百度就别来找我’,如今至少愿意尊重AI辅助诊疗这件事了。”这一转变,成为他决定重新站到台前的关键动因。
曾被视为通用人工智能(AGI)种子选手的百川智能,一度深陷“百模大战”。彼时估值逼近200亿元、高调推出C端产品“百小应”的意气风发,如今已被更为审慎的姿态取代。王小川不再强调打造“超级App”,转而表示“迈过10万用户门槛即可”,语气中透出务实与克制。他亦提及竞品“阿福”的密集营销虽令人“快看吐了”,却客观上完成了市场教育,为AI医生概念铺平道路。
战略转向早有伏笔。2025年4月,百川成立两周年之际,王小川在内部信中反思:“战线拉得太长,从通用基模到医学推理,再到应用与商业化,极大增加了组织复杂度。”如今卸下AGI包袱,他选择回归初心——早在2021年卸任搜狗CEO时,他就曾立誓“未来二十年为生命科学和医学尽一份力”。彼时,黄峥、张一鸣等互联网领袖亦纷纷布局生物科技,视其为理想与红利兼具的赛道。
百川智能自创立之初便以“为生命建模型、为人类造医生”为使命,但AGI热潮使其一度偏离主线。王小川承认,去年中途聚焦医疗时“被骂惨了”,部分员工因理想落差选择离开。此次沟通会,实为重整旗鼓、重建连接之举。
当前中国医疗资源分布不均,下沉市场诊疗信息严重不对称,这为AI提供切入契机。王小川强调,百川短期内不会触碰法定诊疗红线,而是聚焦“辅助决策”——帮助患者理解病情、缩小医患信息差。“患者是自己健康的第一责任人,我们不是替他做决定,而是支持他做出更好决定。”他特别指出,未来医疗服务的巨大增量在院外,而非院内执行环节。
技术层面,Baichuan-M3在全球权威医疗AI评测HealthBench中以65.1分综合得分位居榜首;在考验复杂决策的HealthBench Hard子项中,亦以44.4分夺冠。官方称,该成绩首次在医疗领域全面超越GPT-5.2。尤为关键的是,其医疗幻觉率降至3.5%,为全球最低,且在不依赖外部检索或工具增强的纯模型设定下达成。
区别于轻健康定位的竞品,百川主打“严肃问诊”。模型能像真实医生般主动追问病史、识别风险信号,并基于完整信息进行深度推理。凤凰网科技体验发现,产品支持用户选择“患者”“家属”或“医护”身份,输出内容随之动态调整,并可上传病历、报告、药品及皮肤患处图像。多轮对话逻辑严密,解释清晰而不冗余。
为实现这一能力,百川引入新型强化学习机制,在压制幻觉的同时强化推理。更重要的是,M3首次实现“端到端严肃问诊”内生能力,而非依赖“你是一位经验丰富的医生”这类角色扮演式Prompt。后者仅触发表演行为,无法确保获取关键临床信息。为此,百川提出“SCAN原则”:Safety Stratification(安全分层)、Clarity Matters(信息澄清)、Association & Inquiry(关联追问)、Normative Protocol(规范输出),将医生经验性思维过程系统性“白盒化”,拆解为病史采集、辅助检查、精准诊断三大阶段,通过动态多轮交互模拟完整诊疗流程。
落地层面,百川已以医药厂商身份进入医院临床试验注册阶段,旨在验证产品安全性与依从性。王小川称:“我没见哪个互联网AI公司在干这个。”
财务方面,公司账上现金约30亿元,有望于2027年启动上市,但非强制时间表。与AGI烧钱模式不同,百川将资源集中于语言模型的强化学习,暂未重点投入多模态感知。“医疗核心是决策、符号逻辑与智力,图像只是枝叶,非主干。”王小川解释。
在数据策略上,百川避开高成本、难合规的院内诊疗数据,转而利用高质量公开医学文献、指南与论文,结合与顶级医院专家共建的“评价AI的AI”系统,以较低标注成本驱动模型迭代,训练其掌握临床思维逻辑。
放眼全球,OpenAI的ChatGPT Health与Anthropic的Claude for Healthcare均已入局,印证医疗AI为高价值赛道。百川亦规划出海,但眼下首要任务是让用户认知到:一款低幻觉、高推理、真正贴近临床逻辑的AI医疗产品已然诞生。
这场从宏大AGI叙事向垂直务实工程的转身,既是对过往弯路的修正,亦是对中国医疗痛点的一次精准回应。当部分同行仍在追逐技术范式的星辰大海,王小川选择俯身解决“钢镚级”但关乎亿万人健康的真实问题——若能成功转化技术优势为可持续用户价值,其社会意义或不逊于任何通用智能突破。