微软研究院近日发布了一款名为 Skala 的深度学习交换 - 关联(XC)泛函,旨在为 Kohn–Sham 密度泛函理论(DFT)提供高效的计算方案。

Skala 通过学习非局部效应,使得其计算效率与当前的 meta-GGA 泛函相当,同时在精度上可以达到混合泛函的水平。其在 W4-17分子体系的原子化能量评估中,平均绝对误差(MAE)达到了1.06kcal/mol,其中在单参考子集上更是达到了0.85kcal/mol;在 GMTKN55基准测试中,Skala 的加权均方根绝对误差(WTMAD-2)为3.89kcal/mol,这些结果显示 Skala 在精度上与顶级混合泛函相竞争。

Skala 的设计目标是实现严格的主族热化学计算,而不是在第一时间内提供一个适用于所有领域的通用泛函。该模型并没有尝试学习色散效应,初步版本中仍然使用固定的 D3(BJ) 色散修正。这款工具非常适合应用于需要半局部成本和混合级精度的主族分子化学领域,如高通量反应能量(ΔE)、反应障碍估计、构象 / 自由基稳定性排名及几何和偶极子预测等。

Skala 的架构和训练过程分为两个阶段:首先在 B3LYP 密度上进行预训练,提取高水平波函数能量的 XC 标签;其次进行 SCF 内循环的精细调整,使用 Skala 自己的密度,而无需通过反向传播进行 SCF。Skala 的模型训练基于一套大规模的、高质量的原子化能量数据集,包括约80,000个高精度的总原子化能量(MSR-ACC/TAE)。

为保证效率,Skala 的计算复杂度维持在 O (N³),并且针对 GPU 执行进行了优化。该模型的公开代码和工具包已经在 Azure AI Foundry 实验室和 GitHub 上发布,用户可以直接在 PySCF/ASE 和 GauXC 平台中运行,便于进行高效的批量 SCF 计算。

项目:https://github.com/microsoft/skala?tab=readme-ov-file

划重点:  

🌟 Skala 在 W4-17的 MAE 为1.06kcal/mol,单参考子集为0.85kcal/mol,具备高精度。  

🛠️ 该模型通过学习非局部效应,实现了与当前 meta-GGA 泛函相似的计算效率,目标聚焦于主族化学。  

🚀 Skala 可在 Azure AI Foundry 实验室和 GitHub 上获取,支持高效的分子计算与实验分享。