MIT提出物理先验生成式AI模型SpectroGen:跨模态光谱重建精度达99%,助力材料质量验证提速千倍

ScienceAI 2025-10-23 11:53

MIT提出物理先验生成式AI模型SpectroGen:跨模态光谱重建精度达99%,助力材料质量验证提速千倍图1


MIT提出物理先验生成式AI模型SpectroGen:跨模态光谱重建精度达99%,助力材料质量验证提速千倍图2

编辑丨&

实验室的光谱仪常常是科研流程中最昂贵、最慢的一环。每当新材料被设计出来,它还需经过繁琐的扫描与验证——晶格结构、分子基团,诸如此类。一次完整的表征,往往要切换多台设备、耗费数小时乃至几天。

而在另一端,人工智能的推演速度早已飞奔。计算模型每天生成成千上万种新配方,却被现实的实验节奏拖慢。MIT 的研究团队决定,从「理解光谱」的角度出发,让 AI 也能学会替科学家「测」一次材料。

该研究以「SpectroGen: A physically informed generative artificial intelligence for accelerated cross-modality spectroscopic materials characterization」为题,于 2025 年 10 月 14 日发布在《Matter》。

MIT提出物理先验生成式AI模型SpectroGen:跨模态光谱重建精度达99%,助力材料质量验证提速千倍图3

论文链接:https://www.cell.com/matter/abstract/S2590-2385(25)00477-1

让 AI 理解「光谱的语言」

AI 驱动的材料发现能够快速设计新型材料成分,但合成与表征却相对滞后。尤其是表征环节,仍受限于依赖电磁光谱学、由专家操作仪器进行的劳动密集型实验。

MIT 推出了 SpectroGen,这是一种用于跨模态光谱生成的生成式 AI 模型,旨在加速材料表征。SpectroGen 生成的高分辨率、高信噪比光谱与真实值的相关性达 99%,均方根误差为 0.01 原子单位。

它的关键在于将光谱重新定义为一种数学分布,而非分子信号。每种光谱曲线——无论是高斯形的红外峰,还是洛伦兹形的拉曼线——都能用方程表达。团队据此为模型加入「物理先验」:AI 不再盲目拟合,而是受制于这些已知的分布规律。

MIT提出物理先验生成式AI模型SpectroGen:跨模态光谱重建精度达99%,助力材料质量验证提速千倍图4

图 1:SpectroGen 工作流程。

MIT提出物理先验生成式AI模型SpectroGen:跨模态光谱重建精度达99%,助力材料质量验证提速千倍图5

图 2:建模策略。

在此基础上,研究者构建了一个变分自编码器(VAE)架构。模型先将输入光谱压缩成潜空间的特征分布,再利用这些物理约束生成另一种模态的光谱。  这一「物理+生成」的混合逻辑,使 SpectroGen 既能保持可解释性,又能高速运行。它本质上是一台虚拟光谱仪——输入一种信号,生成另一种测量结果。

用数据打点样

团队以国际矿物学协会标准数据库 RRUFF 为验证集,共使用约 6000 个矿物样本。 在 IR–Raman 和 XRD–Raman 两类跨模态任务中,SpectroGen 生成的光谱与真实实验结果平均相关性达到 99%,强度均方误差仅 0.01 a.u.,结构相似度指数(SSIM)高达 0.96–0.97。

MIT提出物理先验生成式AI模型SpectroGen:跨模态光谱重建精度达99%,助力材料质量验证提速千倍图6

图 3:对红外到拉曼和 X 射线衍射到拉曼任务的整个生成数据集进行了光谱特征评估。

更令人意外的是,AI 生成的光谱信噪比甚至优于实验数据——例如某矿物样本的信噪比由 3.1 提升至 11.1。在信息保持性测试中,研究者用生成光谱训练材料分类网络,准确率达 90.476%,比直接用实验光谱(69.878%)提升约 20 个百分点。

在效率上,SpectroGen 能在一分钟内完成一次完整生成,速度比传统测量快约一千倍。团队指出,这意味着在未来的生产线中,仅需一台红外摄像机即可完成多模态检测,而无需昂贵的 X 射线或拉曼设备。

结语

团队表示,SpectroGen 可以为任何类型的矿物生成光谱。在制造业,它可用于电池、半导体、药物等产业的质量控制,只需一次简单扫描便可获得多模态指标。在科研与药物研发中,研究者能快速筛查大规模候选样本,节省大量实验时间与设备成本。

通过将光谱数据视为一种抽象的数学分布表示,模型能够生成独立于键和晶体结构的标准物理表示的光谱,这种抽象使 SpectroGen 能够弥合物理实验与计算分析之间的差距,拓展光谱生成在各个领域的通用性。

SpectroGen 不是简单的数据拟合,而是一个具有物理意识的生成系统——它知道光谱为何成形,也能在不同实验模式间自洽地「迁移」信息。这类模型或将成为未来科学 AI 的基础模板。

相关链接:https://phys.org/news/2025-10-quality-materials-easier-ai-tool.html

人工智能 × [ 生物 神经科学 数学 物理 化学 材料 ]

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI
more
Meta员工士气跌至20年谷底!内部直播当众开骂,CTO承认AI重组糟糕透顶
AMD和Intel联手,发力AI
微信AI助手灰度上线,诺贝尔化学奖得主加入Anthropic,英特尔携手联电攻坚3nm工艺,挪威小学生将被禁用AI,这就是今天的其他大新闻!
我找到4位被 AI “盗脸”的人,他们是如何抵抗的?
拒绝“人机恋”但拥抱AI助手:Match Group调研揭示单身群体对约会科技的双重态度
GPT-5.4自主攻克药物合成难题,AI化学家初露锋芒
对话王小川:造医生,战豆包,与无尽的 AI 非共识
宇树机器人登顶 6200 米火山;诺奖得主从谷歌跳槽到 Anthropic;AI 教父杨立昆:马斯克的 xAI 失败了 | 极客早知道
刚刚,Codex 大更新,你在电脑的操作正在成为 AI 经验包
我把昨晚的梦输入AI,它居然直接把我拉进去玩儿了一把?!
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号