转自:Daniel René Estrada Vázquez,奇瓦瓦自治大学博士生
作为一名计算化学研究实验室的博士生,我从第一性原理出发构建了 PROPHET——一个集成平台。它读取两个分子的量子力学指纹,回答一个简单却一直难以解答的问题:它们会一起结晶吗?
该系统包含两个由我亲自开发的预测引擎。
第一个是 IBLIS,一个传统机器学习流水线。它将一系列物理“预言”模块——涵盖量子反应性理论、热力学相建模和几何对接——汇总成一个概率共识。在大约1300对经过实验验证的分子组合上,它的表现明显优于历史上的经验法则。效果足够实用,但还没有达到我们的目标。
核心是 ARGUS,这是我开发的一个深度学习引擎。它将分子对的量子拓扑结构处理为空间反应性张量。只要输入活性药物成分(API)和共形成体的量子表面图,它就会返回一个概率。
模型在大约2200对经过实验表征的分子组合上进行了严格的5折交叉验证,确保没有分子同时出现在训练集和测试集中:
ARGUS 标准模式(未见过的分子对):
-
AUC = 0.938
-
F1 = 0.854
ARGUS 严格零样本模式:AUC = 0.925
-
准确率:85.4%
-
精确率:80.5%
-
灵敏度:91.0%
看到这些数字,第一反应是数据泄露。我进行了二次验证:在一个结构家族上训练,在一个化学性质完全不同的保留集上测试。模型依然稳健。它不是死记硬背,而是真正在泛化。
在分子预测中,当你如此接近完美判别时,通常意味着你找到了一种表征方法,能够捕捉到分子在凝聚态中相互作用的某种本质。引入拓扑结构是关键。
在 DC-ROMA RISC-V AI PC 上完成真实验证
我一直是开源的追随者。当我听说开源开放硬件时,一个问题就变得无法回避:整个 PROPHET 技术栈能在 RISC-V 上运行吗?答案是肯定的。
2025年5月,我支付了深度数智 DC-ROMA RISC-V AI PC 的预订费——这是一台搭载8核 SiFive P550 处理器的机器(RISC-V 64位,最高2.0 GHz,乱序执行),内置 NPU,提供 40 TOPS 的本地 AI 算力,32 GB LPDDR5 内存,全部封装在13英寸的 Framework 笔记本电脑机身中。
我本职是研究人员,骨子里是个技术发烧友,总想挑战极限——但研究实验室的生活很难按计划推进,我的项目一再被推迟。深度数智在六个月内一直为我保留预订,没有一句抱怨,没有一次升级投诉,也没有一封自动邮件威胁取消订单。关于交付、规格或物流的每个问题,都得到了真人回复。快速、友善,而且真诚地提供帮助。
我认真对待这份信任——不仅是作为研究人员,更是作为一个相信开放硬件值得真正验证(而不仅仅是写写博客)的人。上周的基准测试结果如下:
Oracle 流水线(物理模块,顺序执行):
-
Intel Haswell i7 @ 2.2 GHz(2015款 MacBook Pro):每对 2.97 秒
-
SiFive P550 RISC-V @ 1.8 GHz(DC ROMA):每对 3.15 秒
-
差距:6%
神经网络推理(ARGUS,INT8 量化 → NPU):
-
朴素的 IPC 协议:每次预测 88 毫秒
-
优化的二进制协议:每次预测 2.7 毫秒
-
加速比:32 倍
模型质量跨架构保持一致:
-
ARGUS AUC:0.938(标准模式),0.925(严格零样本模式)
-
CPU/NPU 一致性:在量化误差范围内
-
五个随机种子的 NPU 验证:通过——没有出现常量分数伪影
开放硅片,已经走出实验室
四十年来,严肃的科学计算一直是专有技术的游戏(Intel、AMD 以及后来的 ARM)。RISC-V则不同——它是一个开放指令集,任何人都无需许可即可实现。
人们一直以来的批评是:这玩意儿对教育挺好,但还没法用于实际工作。我们刚刚在 DC-ROMA 上运行了一个准确率 93.8% 的深度学习流水线——这颗 RISC-V 芯片没有向量扩展,运行频率比我们的 Intel 对比系统低 400 MHz。差距仅为个位数百分比。
再经历一代芯片,这个差距就会归零。到那时,你将得到任何授权费都买不来的东西:一个没人能限制的处理器架构。
致深度数智:感谢这六个月,感谢你们的信任和耐心,你们造出了这块主板,而我证明了它在计算化学领域能做什么,当然后续还有更多......
这是一块拒绝被称为“实验品”的开源硅片,它不是实验品,它就在这里。

·END·
