【科技24时区】大型语言模型(LLM)依托海量数据训练,在基因组学研究加速、临床文档自动化、实时诊断优化、临床决策支持、药物研发提速,乃至生成合成数据以推动实验等方面展现出巨大潜力。然而,其在生物医学领域的变革性承诺常遭遇现实瓶颈:除医疗体系依赖的结构化数据外,这些模型在罕见病或特殊病症等“边缘案例”中表现乏力——因相关高质量、具代表性的真实数据极度稀缺。

针对这一挑战,总部位于纽约的初创公司Mantis Biotech宣称正在开发一套解决方案,旨在弥合关键数据缺口。该公司平台通过整合教科书、动作捕捉摄像头、生物传感器、训练日志及医学影像等多源异构数据,构建可用于生成“人体数字孪生”的合成数据集。这些数字孪生是基于物理规律的预测性模型,可精确模拟人体解剖结构、生理功能乃至行为模式。
Mantis公司表示,此类数字孪生可用于医学数据聚合与分析,支持新诊疗方案的研究与测试、手术机器人训练,以及对健康风险或行为模式的模拟与预测。例如,一支职业橄榄球队可基于某位NFL球员近期表现、训练负荷、饮食状况及职业生涯时长,预测其跟腱损伤风险。公司创始人兼首席执行官乔治亚·威切尔(Georgia Witchel)在接受TechCrunch采访时表示:“我们能将这些分散的数据源转化为预测人类表现的模型——任何需要预测个体行为或生理反应的场景,都是我们技术的理想应用。”
该平台的核心在于其物理引擎层。威切尔强调,该引擎不仅将合成数据锚定于真实的解剖物理规律,还能显著增强有限原始信息的可用性。她举例称:“若要对缺失一根手指的人进行手部姿态估计,现有公开数据集中几乎找不到标注样本;而我们只需在物理模型中移除指定手指并重新生成,即可轻松创建所需数据集。”
鉴于生物医学领域普遍存在数据获取困难、格式非结构化或被“数据孤岛”割裂的问题,尤其在涉及伦理与监管限制的罕见病研究中,真实患者数据难以用于AI训练,Mantis的技术路径具有广泛适用前景。威切尔指出:“我希望人们能像孩子玩芭比娃娃一样‘折腾’我们的数字孪生——这意味着在虚拟人体上进行安全、无伦理负担的测试成为可能。”她同时强调,真实患者的隐私必须受到尊重,其数据不应被滥用,而数字孪生恰恰为此提供了替代方案。
目前,Mantis已在职业体育领域取得初步成功,主要客户包括一支NBA球队。通过构建运动员的数字分身,平台可追踪其过去一年中每日跳跃表现,并关联睡眠时长、手臂上举频率等变量,动态分析运动能力变化趋势。
该公司近期完成740万美元种子轮融资,由Decibel VC领投,Y Combinator、Liquid 2及多位天使投资人参投。资金将用于团队扩充、市场推广及商业化落地。展望未来,Mantis计划持续完善技术平台,最终向公众开放,聚焦预防性健康管理;同时正积极拓展制药实验室与FDA临床试验研究者客户,旨在提供患者治疗响应的深度洞察,推动精准医疗发展。