基于能量分片的在线机器学习力场

 传统量子化学方法的计算量随体系增大呈指数增长,难以应用于复杂体系(如纳米材料、生物大分子、溶液等)的理论研究,因此发展大体系的高效量子化学计算方法是理论化学的热点和挑战。南京大学黎书华教授、李伟副教授、马晶教授等前期发展了一种基于能量的分片(Generalized Energy-Based Fragmentation, GEBF)方法\[1],该方法把大体系的总能量表示为一系列静电嵌入的子体系能量的线性组合,该方法简单有效,可以在量子化学水平上快速实现大分子和凝聚相体系的能量、几何结构、振动光谱、电子光谱和核磁等性质的计算。然而,GEBF方法的计算量仍然远远大于传统分子力场方法,从而很难用于复杂体系的长时间动力学模拟。

2020年5月,黎书华教授、李伟副教授、马晶教授等在GEBF分片方法的基础上,结合了基于高斯势函数的机器学习方法,发展了一种基于分片方法的在线机器学习力场(GEBF-ML,如图A)\[2]。在该方法中,目标大分子的总能量、力和分子性质可以通过组合GEBF子体系的机器学习力场获得。在机器学习中,采用了高斯势函数模型,子体系的力场可以在动力学模拟过程中在线自动构建,而不需要提前采集数据,也不用进行参数优化。利用该在线训练技术,用于构建力场的数据集大小仅为早期采用自主学习迭代构建的数据集的三分之一,从而大大降低了目前机器学习力场构建需要花费的时间。本项研究测试了不同尺寸的烷烃链,得到的红外光谱和从头算动力学模拟结果高度吻合 (图B)。基于GEBF的机器学习力场未来有望被广泛用于复杂大分子和凝聚相体系的长时间动力学模拟和性质的研究。该研究最近已经在美国化学会期刊([_J. Phys. Chem. A_ **2020**, _124_, 5007](https://pubs.acs.org/doi/10.1021/acs.jpca.0c04526))发表\[2]。南京大学化学化工学院、理论与计算化学研究所的博士研究生程正为论文的第一作者,[黎书华教授](https://itcc.nju.edu.cn/shuhua/)和[李伟副教授](../home.md)为共同通讯作者,马晶教授和南京大学匡亚明学院的赵东波博士为共同作者。

参考文献:

  1. Li, S.*; Li, W.; Ma, J. Generalized Energy-Based Fragmentation Approach and Its Applications to Macromolecules and Molecular Aggregates. Acc. Chem. Res. 2014, 47 (9), 2712–2720. https://doi.org/10.1021/ar500038z.
  2. Cheng, Z.; Zhao, D.; Ma, J.; Li, W.*; Li, S.* An On-the-Fly Approach to Construct Generalized Energy-Based Fragmentation Machine Learning Force Fields of Complex Systems. J. Phys. Chem. A 2020, 124 (24), 5007–5014. https://doi.org/10.1021/acs.jpca.0c04526.

最近修改 李伟 1103004, 2021-01-14