物质中电子的排列(称为电子结构)在药物设计和能量存储等基础研究和应用研究中发挥着至关重要的作用。然而,缺乏在不同时间和长度尺度上提供高保真度和可扩展性的模拟技术长期以来一直是这些技术进步的障碍。
德国格尔利茨亥姆霍兹德累斯顿-罗森多夫中心(HZDR)高级系统理解中心(CASUS)和美国新墨西哥州阿尔伯克基桑迪亚国家实验室的研究人员现已开创了一种基于机器学习的模拟方法取代传统的电子结构仿真技术。
他们的材料学习算法(MALA)软件堆栈可以访问以前无法实现的长度尺度。该工作发表在《npj计算材料》杂志上。
电子是具有根本重要性的基本粒子。它们之间以及与原子核之间的量子力学相互作用产生了化学和材料科学中观察到的多种现象。了解和控制物质的电子结构可以深入了解分子的反应性、行星内的结构和能量传输以及材料失效的机制。
科学挑战越来越多地通过计算建模和模拟、利用高性能计算的能力来解决。然而,实现具有量子精度的真实模拟的一个重大障碍是缺乏将高精度与跨不同长度和时间尺度的可扩展性结合起来的预测建模技术。
经典原子模拟方法可以处理大型复杂系统,但其对量子电子结构的省略限制了其适用性。相反,不依赖于经验建模和参数拟合(第一原理方法)等假设的模拟方法提供了高保真度,但计算要求较高。例如,密度泛函理论(DFT)是一种广泛使用的第一原理方法,它表现出随系统尺寸的三次缩放,从而将其预测能力限制在小尺度上。
基于深度学习的混合方法
研究人员团队现在提出了一种新颖的模拟方法,称为材料学习算法(MALA)软件堆栈。在计算机科学中,软件堆栈是算法和软件组件的集合,它们组合在一起创建用于解决特定问题的软件应用程序。
伦茨·费德勒博士CASUS的学生和MALA的主要开发人员解释说:“MALA将机器学习与基于物理的方法相结合来预测材料的电子结构。它采用了一种混合方法,利用一种称为深度学习的既定机器学习方法来准确预测局部量,并辅以用于计算感兴趣的全局量的物理算法。”
MALA软件堆栈将空间中原子的排列作为输入,并生成称为双谱分量的指纹,对笛卡尔网格点周围原子的空间排列进行编码。MALA中的机器学习模型经过训练,可以根据该原子邻域预测电子结构。MALA的一个显着优势是其机器学习模型能够独立于系统规模,使其能够根据小型系统的数据进行训练并以任何规模进行部署。
研究小组在其出版物中展示了这一策略的显着有效性。与传统算法相比,对于由多达数千个原子组成的较小系统规模,他们实现了1,000倍以上的加速。此外,该团队还证明了MALA能够准确执行大规模电子结构计算,涉及超过100,000个原子。值得注意的是,这一成就是通过适度的计算工作实现的,揭示了传统DFT代码的局限性。
CASUS极端条件下物质部门代理系主任AttilaCangi解释道:“随着系统规模的增大和涉及的原子数量的增加,DFT计算变得不切实际,而MALA的速度优势不断增强。MALA的关键突破在于其“能够在本地原子环境中运行,从而实现精确的数值预测,并且受系统尺寸的影响最小。这一突破性的成就开启了曾经被认为无法实现的计算可能性。”
预计将推动应用研究
Cangi旨在利用机器学习突破电子结构计算的界限。“我们预计MALA将引发电子结构计算的变革,因为我们现在有一种方法可以以前所未有的速度模拟更大的系统。未来,研究人员将能够基于显着的计算能力解决广泛的社会挑战。改善基线,包括开发新疫苗和新型储能材料、对半导体器件进行大规模模拟、研究材料缺陷以及探索将大气温室气体二氧化碳转化为气候友好矿物质的化学反应。”
此外,MALA的方法特别适合高性能计算(HPC)。随着系统规模的增长,MALA可以在其使用的计算网格上进行独立处理,从而有效地利用HPC资源,特别是图形处理单元。
桑迪亚国家实验室的科学家兼并行计算专家SivaRajamanickam解释说:“MALA的电子结构计算算法很好地映射到具有分布式加速器的现代HPC系统。分解工作并跨不同网格点并行执行的能力加速器使MALA成为HPC资源上可扩展机器学习的理想选择,从而在电子结构计算中实现无与伦比的速度和效率。”
标签:
免责声明:本文由用户上传,如有侵权请联系删除!