MIT提出物理先验生成式AI模型SpectroGen:跨模态光谱重建精度达99%,助力材料质量验证提速千倍

ScienceAI 2025-10-23 11:53

MIT提出物理先验生成式AI模型SpectroGen:跨模态光谱重建精度达99%,助力材料质量验证提速千倍图1


MIT提出物理先验生成式AI模型SpectroGen:跨模态光谱重建精度达99%,助力材料质量验证提速千倍图2

编辑丨&

实验室的光谱仪常常是科研流程中最昂贵、最慢的一环。每当新材料被设计出来,它还需经过繁琐的扫描与验证——晶格结构、分子基团,诸如此类。一次完整的表征,往往要切换多台设备、耗费数小时乃至几天。

而在另一端,人工智能的推演速度早已飞奔。计算模型每天生成成千上万种新配方,却被现实的实验节奏拖慢。MIT 的研究团队决定,从「理解光谱」的角度出发,让 AI 也能学会替科学家「测」一次材料。

该研究以「SpectroGen: A physically informed generative artificial intelligence for accelerated cross-modality spectroscopic materials characterization」为题,于 2025 年 10 月 14 日发布在《Matter》。

MIT提出物理先验生成式AI模型SpectroGen:跨模态光谱重建精度达99%,助力材料质量验证提速千倍图3

论文链接:https://www.cell.com/matter/abstract/S2590-2385(25)00477-1

让 AI 理解「光谱的语言」

AI 驱动的材料发现能够快速设计新型材料成分,但合成与表征却相对滞后。尤其是表征环节,仍受限于依赖电磁光谱学、由专家操作仪器进行的劳动密集型实验。

MIT 推出了 SpectroGen,这是一种用于跨模态光谱生成的生成式 AI 模型,旨在加速材料表征。SpectroGen 生成的高分辨率、高信噪比光谱与真实值的相关性达 99%,均方根误差为 0.01 原子单位。

它的关键在于将光谱重新定义为一种数学分布,而非分子信号。每种光谱曲线——无论是高斯形的红外峰,还是洛伦兹形的拉曼线——都能用方程表达。团队据此为模型加入「物理先验」:AI 不再盲目拟合,而是受制于这些已知的分布规律。

MIT提出物理先验生成式AI模型SpectroGen:跨模态光谱重建精度达99%,助力材料质量验证提速千倍图4

图 1:SpectroGen 工作流程。

MIT提出物理先验生成式AI模型SpectroGen:跨模态光谱重建精度达99%,助力材料质量验证提速千倍图5

图 2:建模策略。

在此基础上,研究者构建了一个变分自编码器(VAE)架构。模型先将输入光谱压缩成潜空间的特征分布,再利用这些物理约束生成另一种模态的光谱。  这一「物理+生成」的混合逻辑,使 SpectroGen 既能保持可解释性,又能高速运行。它本质上是一台虚拟光谱仪——输入一种信号,生成另一种测量结果。

用数据打点样

团队以国际矿物学协会标准数据库 RRUFF 为验证集,共使用约 6000 个矿物样本。 在 IR–Raman 和 XRD–Raman 两类跨模态任务中,SpectroGen 生成的光谱与真实实验结果平均相关性达到 99%,强度均方误差仅 0.01 a.u.,结构相似度指数(SSIM)高达 0.96–0.97。

MIT提出物理先验生成式AI模型SpectroGen:跨模态光谱重建精度达99%,助力材料质量验证提速千倍图6

图 3:对红外到拉曼和 X 射线衍射到拉曼任务的整个生成数据集进行了光谱特征评估。

更令人意外的是,AI 生成的光谱信噪比甚至优于实验数据——例如某矿物样本的信噪比由 3.1 提升至 11.1。在信息保持性测试中,研究者用生成光谱训练材料分类网络,准确率达 90.476%,比直接用实验光谱(69.878%)提升约 20 个百分点。

在效率上,SpectroGen 能在一分钟内完成一次完整生成,速度比传统测量快约一千倍。团队指出,这意味着在未来的生产线中,仅需一台红外摄像机即可完成多模态检测,而无需昂贵的 X 射线或拉曼设备。

结语

团队表示,SpectroGen 可以为任何类型的矿物生成光谱。在制造业,它可用于电池、半导体、药物等产业的质量控制,只需一次简单扫描便可获得多模态指标。在科研与药物研发中,研究者能快速筛查大规模候选样本,节省大量实验时间与设备成本。

通过将光谱数据视为一种抽象的数学分布表示,模型能够生成独立于键和晶体结构的标准物理表示的光谱,这种抽象使 SpectroGen 能够弥合物理实验与计算分析之间的差距,拓展光谱生成在各个领域的通用性。

SpectroGen 不是简单的数据拟合,而是一个具有物理意识的生成系统——它知道光谱为何成形,也能在不同实验模式间自洽地「迁移」信息。这类模型或将成为未来科学 AI 的基础模板。

相关链接:https://phys.org/news/2025-10-quality-materials-easier-ai-tool.html

人工智能 × [ 生物 神经科学 数学 物理 化学 材料 ]

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI
more
6800万美元,清华、北大、上海交大多位校友获奖,亚马逊AI博士奖学金公布
济南大学举行《智能蜕变》新书发布会,111位大咖联袂力荐,开启AI时代生存指南
OpenAI推出浏览器:“让位吧,Chrome”
AI脑机伦理委员会:权力博弈中的“智能神经伦理”新战场
剂泰科技MTS-004成为国内首款完成三期临床的AI赋能制剂新药
AI首波受害者出现!双11内存硬盘疯涨了,怎么买?
阿里把「豆包」塞进夸克,用了半天后我发现它和 OpenAI 想一块去了
Meta AI狠裁600人,「封杀」ChatGPT,连图灵奖得主都曾气到想跑路
AI 如何重塑开发者未来十年 | 直播预告
第一批AI受害者,是中小学语文老师
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号