SCALFFT_PRE_A2A_ALGO

设置计算3D FFT时pre阶段的转置算法。

可选值

表1 参数定义

参数名

数值

描述

A2A_ALGO_AUTO_TUNING

0

库根据进程数和输入矩阵的大小自动选择最优转置算法。

A2A_ALGO_COLL_TASK_ALLTOALLV

1

使用MPI A2A接口的task化转置算法。

A2A_ALGO_P2P_TASK_LINEAR

2

使用linear A2A的task化转置算法。

A2A_ALGO_P2P_TASK_PAIRWISE

3

使用pairwise A2A的task化转置算法。

A2A_ALGO_P2P_PIPELINE_LINEAR

4

pipeline转置算法。

A2A_ALGO_P2P_LAMMPS

5

Lammps原非集合通信转置算法。

A2A_ALGO_P2P_PAIRWISE_WO_PACK

6

使用pairwise A2A,无pack流程的转置算法,当前仅支持slab分解。

A2A_ALGO_P2P_LINEAR_WO_PACK

7

使用linear A2A,无pack流程的转置算法,当前仅支持slab分解。

示例

通过设置环境变量“-x SCALFFT_PRE_A2A_ALGO=2”,指定扩展接口计算3D FFT时pre阶段的转置算法为linear算法。