设置计算3D FFT时pre阶段的转置算法。
参数名 |
数值 |
描述 |
---|---|---|
A2A_ALGO_AUTO_TUNING |
0 |
库根据进程数和输入矩阵的大小自动选择最优转置算法。 |
A2A_ALGO_COLL_TASK_ALLTOALLV |
1 |
使用MPI A2A接口的task化转置算法。 |
A2A_ALGO_P2P_TASK_LINEAR |
2 |
使用linear A2A的task化转置算法。 |
A2A_ALGO_P2P_TASK_PAIRWISE |
3 |
使用pairwise A2A的task化转置算法。 |
A2A_ALGO_P2P_PIPELINE_LINEAR |
4 |
pipeline转置算法。 |
A2A_ALGO_P2P_LAMMPS |
5 |
Lammps原非集合通信转置算法。 |
A2A_ALGO_P2P_PAIRWISE_WO_PACK |
6 |
使用pairwise A2A,无pack流程的转置算法,当前仅支持slab分解。 |
A2A_ALGO_P2P_LINEAR_WO_PACK |
7 |
使用linear A2A,无pack流程的转置算法,当前仅支持slab分解。 |
通过设置环境变量“-x SCALFFT_PRE_A2A_ALGO=2”,指定扩展接口计算3D FFT时pre阶段的转置算法为linear算法。