Meta放大招!科研党狂喜!AI化学工具包来了!
Meta最近搞了个大新闻,一口气扔出了两个超厉害的宝贝:一个是号称史上最大的AI化学开放数据集OMol25,另一个是能预测分子和材料化学性质的通用AI模型UMA(Universal Atom Model)。这俩家伙加起来,简直就是科研加速器,以后搞药物研发、电池材料啥的,效率要起飞啦!
OMol25:数据量爆炸!
Meta说,OMol25数据集里包含了超过1亿次高精度的分子计算数据,比之前公开的所有同类数据集加起来都多!为了搞出这么个庞然大物,Meta的电脑们可是足足跑了60亿个小时!这数据量,简直就是一座金矿啊!OMol25覆盖的分子种类也超全,从小小的有机物、蛋白质DNA片段,到金属复合物、电解质,应有尽有。更棒的是,它还包含了分子的带电状态、自旋状态、各种姿势(构象)以及化学反应的信息,还有能量、力值、电荷分布这些细节数据。现在,OMol25已经在Hugging Face平台上免费开放啦,大家快去薅羊毛!
UMA模型:预测速度嗖嗖的!
跟OMol25一起发布的UMA模型,是Meta用OMol25和其他数据集训练出来的全新AI模型。UMA最牛的地方在于,它能在原子级别预测化学性质,而且速度超级快!以前要为特定任务专门构建模型,现在UMA一个模型就能搞定所有,从分子模拟(找新药)到材料和催化研究,通通不在话下。UMA用的是先进的图神经网络,还用了“混合线性专家”架构,保证了计算速度和预测精度都棒棒的。在测试中,UMA的表现已经达到了以前只有精心调整过的专用模型才能达到的水平,简直是开挂!
Meta还说,有了UMA,以前要花好几天才能完成的分子模拟和计算,现在几秒钟就能搞定!这就能让研究人员在实验室合成之前,快速筛选成千上万种可能的新分子,大大提高评估药物或电池材料潜力的效率。UMA模型也已经在Hugging Face上开放获取了,赶紧安排上!
新招式:“伴随采样”!
Meta还整了个新活,叫“伴随采样”,是一种全新的AI分子模拟方法。以前的AI模型要生成新分子结构,得靠大量真实世界的数据。但是“伴随采样”厉害了,就算没啥真实样本,也能学习并提出新的分子结构!这技术借鉴了随机控制理论和扩散过程的概念,Meta觉得扩散过程特别适合模拟分子。实验证明,“伴随采样”只要少量计算,就能快速探索多种分子结构,而且生成的分子构象不仅能和传统软件的结果相匹配,在处理多个灵活组件的分子时,表现甚至更好!相关的模型、代码和更多信息已经在Hugging Face和GitHub上分享了。
当然,还有进步空间
Meta也承认,现在还有些问题。比如,对于聚合物、某些金属或者复杂的质子化状态这些化学领域,数据的覆盖还不够全面。另外,AI模型在预测电荷、自旋和长程相互作用这些性质方面,还有提升的空间。不过,这已经很厉害了,期待Meta继续给力,搞出更多好东西!