时间:2020年10月8日
地点:机电信息楼
参会人员:胡长军、任帅、储根深、陈丹丹、白鹤。
主持人:任帅
正文:
一、会议主要内容
- 任帅讲解了深度学习用于MD计算的基本概念以及鄂维南团队DeepMD的工作流程,大家讨论并基本理解了1)DeepMD中所谓“邻域”的构建方法,2)DeepMD如何利用神经网络方法进行模型训练。对于DeepMD使用lammps的NeighborList进行数据压缩与排列的优化方法还需要结合其程序代码进行消化;
- 胡老师提出模拟大数据具有的几方面特点,指出要针对这方面工作调研国内外相关文献,明确我们针对这部分工作的思路是否可行,并补充几方面特点的说法与具体实例;
- 储根深大致讲解了DeepMD-kit软件的架构(概览),大致说明了软件包含的各部分模块与功能。其核心代码3万来行,其中模型训练与测试代码1万行左右(python为主),主库代码近2万行(包含lammps,ipi模拟软件的势函数集成,深度势函数的实现等)。
二、行动项
下次会议之前:
- 理清DeepMD中针对MD模拟的深度学习方法与计算优化的工作流程;
- 调研国内外针对模拟大数据的相关工作,以及增加材料、燃料等限定词后是否具有不同的特点与处理方法;
DeepMD-kit的代码解读:先研究神经网络模型训练部分的代码(python部分)。1. 待有更深入了解后,确定其方法是否可用于MISA-MD 程序以及是否有更有的方案(如机器学习方法是否必须是神经网络?针对MISA-MD的本身数据结构来做,是否比基于lammps的NeighborList来做更简单/更复杂,我们的MD程序是否有优势或者劣势?)。2. 评估其势函数计算复杂性,相对于传统势函数增加了多大的计算量,如何优化或者有无效率更高的机器学习方法?