• 主题:ANT-MOC全机应用问题讨论
  • 时间:下午
  • 地点:机电信息楼421
  • 报告人:耿晓旭
  • 内容:ANT-MOC主要核心功能模块及原理分享

    未来工作

    ANT-MOC现状

    1. 算法:并行效率在 50% 左右(9 万 CPU 核算例,500 DCU 算例),实际应用中会浪费很多计算资源。
    2. 模型:特征线法收敛慢(上千次迭代),实际计算时间很长。

    拟解决问题

    1. MOC-理论加速方法缺失,程序加速仍待改进。
      问题描述:现有特征线程序未进行理论加速,计算耗时和资源占用还有待进一步优化提升。需重点研究理论加速方法
    • 建议1:降低迭代次数
      引入规则/非规则几何粗网有限差分(包括特殊几何包括对快堆六角形重复几何、对特种微堆特有的燃料棒栅元、控制棒栅元、控制鼓复杂布置的几何结构)、能群和粗网耦合加速、多级加速等综合手段,降低外迭代次数
    • 建议2:减少单次迭代计算量,改善其工程实用性
      结合算法级核心求解器加速方法研究,从减少特征线总量或者单根和单段特征线计算时间入手,缩短单次特征线内迭代扫描计算时间。
    1. MOC存在大量迭代和归约累积舍入误差
      建议1:建立系统性的精度分析方法。根据三维特征线法各种数据对精度的需求和设备对浮点精度的支持,建立包含单精度和双精度的热点区域精度分析模型,并且实现运行时精度修复。
      建议2:控制中子通量求和中的舍入误差,使用精度分析模型系统性地跟踪分析通量数据在整个三维特征线法程序的计算,识别误差来源,随后在误差较大的代码区域引入自适应求和,根据误差变化情况在运行时切换高精度求和算法,控制并行计算过程中的误差。
    2. 超算平台-负载不均衡,数据传输量大
    • 子问题1:当前ANT-MOC缺少对复杂几何网格中负载较大的热点区域的识别,导致节点之间的负载不均衡。
      • 建议一:根据现有算例和性能分析结果,提取复杂几何网格划分后的负载分布特征,识别负载较大的热点区域,分析此种区域内部的网格形状特征。根据热点分析结果,选取适当的区域分解策略,建立模型估计典型算例在新分解算法中的负载分布情况。
      • 建议二:根据数据分解算法对特征线分布的要求,建立特征线在区域间的连接规则,便于后续传递角通量数据。根据典型算例的负载分布情况开发自适应负载平衡模块,以适应不同算例对数据分解的需求。在自适应过程中加入网格边界检测,研究基于特征线法网格信息的局部边界合并方法,在不损失精度的情况下减少过度细化。
    • 子问题2:并行特征线法数据传输量较大
      • 建议一:要建模跨节点和跨设备的通信,利用典型算例分析不同来源的数据传输模式和计算模式,根据并行特征线法原理建立参数化模型以便实现自适应通信优化。根据性能分析结果,在涉及MPI和HIP两种主要编程模型的模块中引入异步和双缓冲机制,提高计算资源利用率。
      • 建议二:研究基于加速设备架构特点的数据压缩方法,尤其要研究特征线数据和网格数据在GPU上的压缩和快速重建,充分利用设备线程组同步和异步操作减少条件分支开销,减轻数据传输和数据重建的压力。

Leave a Reply

Your email address will not be published.