Midjourney操作界面

Meta 联合发布 OMol25 数据集与 UMA 模型,AI 助力全球化学创新

4.8
0热度

IT之家 5 月 16 日消息,Meta AI 公司于 5 月 14 日发布博文,发布了全新化学数据集 Open Molecules 2025(OMol25)以及通用原子模型 Universal Models for Atoms(UMA)。OMol25 数据集:化学研究新利器OMol25 是迄今为止规模最大的分子模拟数据集,由 Meta 与美国能源部劳伦斯伯克利国家实验室(Berkeley La

IT之家 5 月 16 日消息,Meta AI 公司于 5 月 14 日发布博文,发布了全新化学数据集 Open Molecules 2025(OMol25)以及通用原子模型 Universal Models for Atoms(UMA)。

OMol25 数据集:化学研究新利器

OMol25 是迄今为止规模最大的分子模拟数据集,由 Meta 与美国能源部劳伦斯伯克利国家实验室(Berkeley Lab)联合打造,该数据集包含超过 1 亿个 3D 分子快照,基于密度泛函理论(DFT)计算而成。

DFT 是一种强大的工具,能精确模拟原子间相互作用,帮助科学家预测每个原子的受力及系统能量,从而揭示分子运动和化学反应的规律。

传统的 DFT 计算需要巨大的计算资源,随着分子规模增大,计算需求呈指数级增长,使用最先进的计算设备,也难以模拟现实世界中复杂的分子系统。

基于 DFT 数据训练的机器学习原子间势(MLIPs)能以快 1 万倍的速度提供同等精度的预测,让科学家能在普通计算系统上模拟大型原子系统。OMol25 作为化学多样性最高的分子数据集,为训练 MLIPs 提供了前所未有的数据支持。

UMA 模型:通用预测工具问世

Meta 公司还推出 UMA,是一个基于过去五年 Meta FAIR 公开数据集构建的通用原子间势能模型群,覆盖分子、材料、触媒等化学领域,利用超过 50 亿个原子组成的 3D 结构作为训练数据。

UMA 分为 UMA-small 和 UMA-medium 两种规模,采用“Mixture of Linear Experts”创新架构,其中 UMA-medium 模型拥有 14 亿参数,但单结构计算仅用约 5000 万参数,加快推理速度。

UMA 模型无需微调,仅通过预训练即可应对多种化学任务,性能媲美甚至超越现有专用模型。研究表明,UMA 在分子特性预测、材料设计、触媒开发、能量存储及半导体制造等领域表现出色,高精度与快速计算能力为科学研究和工业应用开辟了新路径,推动跨领域技术革新。

IT之家附上参考地址

  • The Open Molecules 2025 (OMol25) Dataset, Evaluations, and Models

  • Sharing new breakthroughs and artifacts supporting molecular property prediction, language processing, and neuroscience

  • Computational Chemistry Unlocked: A Record-Breaking Dataset to Train AI Models has Launched - Berkeley Lab – Berkeley Lab News Center

  • UMA: A Family of Universal Models for Atoms | Research - AI at Meta

  • facebook/OMol25 · Hugging Face

  • facebook/UMA · Hugging Face

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

点赞(0)

评论列表 共有 0 条评论

暂无评论
发表
评论
顶部