在调用Hyper MPI跑应用时,会同时调用MPI_Allreduce、MPI_Bcast操作,此时的推荐算法命令示例如下(ARM):
mpirun -np 16 -N 2 --hostfile hf --mca btl ^vader,tcp,openib --map-by socket --rank-by core --bind-to core -x UCX_TLS=sm,rc_x -x UCX_BUILTIN_BCAST_ALGORITHM=4 -x UCX_BUILTIN_ALLREDUCE_ALGORITHM=8 -x UCX_BUILTIN_DEGREE_INTER_FANOUT=7 -x UCX_BUILTIN_DEGREE_INTER_FANIN=7 -x UCX_BUILTIN_DEGREE_INTRA_FANOUT=3 -x UCX_BUILTIN_DEGREE_INTRA_FANIN=8 ./wrf.exe