Hyper MPI 1.3.*及以上版本命令参数
本文介绍当前Hyper MPI 1.3.*及以上版本命令参数。
使用Hyper MPI命令参数指定算法时,可以参考算法地图了解具体参数值的含义。
Hyper MPI 1.3.*版本命令参数 |
取值 |
参数说明 |
---|---|---|
-x UCG_PLANC_UCX_ALLREDUCE_FANOUT_INTER_DEGREE= |
|
可选参数,Allreduce算法的算法序号为5、6、7和8时的参数。 示例: -x UCG_PLANC_UCX_ALLREDUCE_FANOUT_INTER_DEGREE=8 |
-x UCG_PLANC_UCX_ALLREDUCE_FANIN_INTER_DEGREE= |
|
可选参数,Allreduce算法的算法序号为5、6、7和8时的参数。 示例: -x UCG_PLANC_UCX_ALLREDUCE_FANIN_INTER_DEGREE=8 |
-x UCG_PLANC_UCX_ALLREDUCE_FANOUT_INTRA_DEGREE= |
|
可选参数,Allreduce算法的算法序号为7和8时的参数。 示例: -x UCG_PLANC_UCX_ALLREDUCE_FANOUT_INTRA_DEGREE=2 |
-x UCG_PLANC_UCX_ALLREDUCE_FANIN_INTRA_DEGREE= |
|
可选参数,Allreduce算法的算法序号为7和8时的参数。 示例: -x UCG_PLANC_UCX_ALLREDUCE_FANIN_INTRA_DEGREE=4 |
-x UCG_PLANC_UCX_BARRIER_FANOUT_INTER_DEGREE= |
|
可选参数,Barrier算法的算法序号为4、5、6和7时的参数。 示例: -x UCG_PLANC_UCX_BARRIER_FANOUT_INTER_DEGREE=8 |
-x UCG_PLANC_UCX_BARRIER_FANIN_INTER_DEGREE= |
|
可选参数,Barrier算法的算法序号为4、5、6和7时的参数。 示例: -x UCG_PLANC_UCX_BARRIER_FANIN_INTER_DEGREE=8 |
-x UCG_PLANC_UCX_BARRIER_FANOUT_INTRA_DEGREE= |
|
可选参数,Barrier算法的算法序号为6和7时的参数。 示例: -x UCG_PLANC_UCX_BARRIER_FANOUT_INTRA_DEGREE=2 |
-x UCG_PLANC_UCX_BARRIER_FANIN_INTRA_DEGREE= |
|
可选参数,Barrier算法的算法序号为6和7时的参数。 示例: -x UCG_PLANC_UCX_BARRIER_FANIN_INTRA_DEGREE=8 |
-x UCG_PLANC_UCX_BCAST_ATTR= |
|
可选参数,Bcast的算法参数。 示例: -x UCG_PLANC_UCX_BCAST_ATTR=I:4 |
-x UCG_PLANC_UCX_ALLREDUCE_ATTR= |
|
可选参数,Allreduce的算法参数。 示例: -x UCG_PLANC_UCX_ALLREDUCE_ATTR=I:7 |
-x UCG_PLANC_UCX_BARRIER_ATTR= |
|
可选参数,Barrier的算法参数。 示例: -x UCG_PLANC_UCX_BARRIER_ATTR=I:1 |
-x UCG_PLANC_UCX_ALLTOALLV_ATTR= |
|
可选参数,Alltoallv的算法参数。 示例: -x UCG_PLANC_UCX_ ALLTOALLV_ATTR=I:1 |
-x UCG_PLANC_UCX_ALLGATHERV_ATTR= |
|
可选参数,Allgatherv的算法参数。 示例: -x UCG_PLANC_UCX_ ALLGATHERV_ATTR=I:3 |
-x UCG_PLANC_UCX_SCATTERV_ATTR= |
|
可选参数,Scatterv的算法参数。 示例: -x UCG_PLANC_UCX_ SCATTERV_ATTR=I:1 |
-x UCG_PLANC_UCX_GATHERV_ATTR= |
|
可选参数,Gatherv的算法参数。 示例: -x UCG_PLANC_UCX_ GATHERV_ATTR=I:1 |
-x UCG_PLANC_UCX_BCAST_NA_KNTREE_INTER_DEGREE= |
|
可选参数,Bcast算法的算法序号为3和4时的参数。 示例: -x UCG_PLANC_UCX_BCAST_NA_KNTREE_INTER_DEGREE=8 |
-x UCG_PLANC_UCX_BCAST_NA_KNTREE_INTRA_DEGREE= |
|
可选参数,Bcast算法的算法序号为4时的参数。 示例: -x UCG_PLANC_UCX_BCAST_NA_KNTREE_INTRA_DEGREE=2 |
-x UCG_PLANC_UCX_REDUCE_KNTREE_DEGREE= |
|
可选参数,Allreduce算法的算法序号为2、3、5、6、7和8时的参数。 示例: -x UCG_PLANC_UCX_REDUCE_KNTREE_DEGREE=2 |
-x UCG_PLANC_UCX_SCATTERV_KNTREE_DEGREE= |
|
可选参数,Scatterv算法的算法序号为2时的参数。 示例: -x UCG_PLANC_UCX_SCATTERV_KNTREE_DEGREE=2 |
-x UCG_PLANC_UCX_SCATTERV_MIN_SEND_BATCH= |
|
可选参数,Scatterv算法的算法序号为1时,发送批处理模式的最小边界值。 示例: -x UCG_PLANC_UCX_SCATTERV_MIN_SEND_BATCH=1 |
-x UCG_PLANC_UCX_SCATTERV_MAX_SEND_BATCH= |
|
可选参数,Scatterv算法的算法序号为1时,发送批处理模式的最大边界值。 示例: -x UCG_PLANC_UCX_SCATTERV_MIN_SEND_BATCH=1 |
-x UCG_PLANC_UCX_NPOLLS= |
|
可选参数,P2P请求测试UCP进度轮询周期数。 示例: -x UCG_PLANC_UCX_NPOLLS=3 说明:
在涉及原子操作的单边请求(例如osu的benchmark:osu_get_acc_latency/osu_acc_latency)场景中,可通过减小该值(例如设置为0),提高性能。 |
-x UCG_PLANC_UCX_USE_OOB= |
|
可选参数,复用ompi pml ucx链路。 示例: -x UCG_PLANC_UCX_USE_OOB=yes |
-x UCG_USE_MT_MUTEX= |
|
可选参数,在UCG中支持多线程的锁的实现方式。 示例: -x UCG_USE_MT_MUTEX=n |
-x UCG_LOG_LEVEL= |
|
可选参数,指定UCG日志级别。 示例: -x UCG_LOG_LEVEL=warn |
-x UCG_PLANC_UCX_PLANM= |
|
可选参数,是否加载闭源库。 示例: -x UCG_PLANC_UCX_PLANM=all |
-x UCG_PLANC_UCX_ALLREDUCE_NUM_NAP_GROUP= |
|
可选参数,Allreduce算法的算法序号为11时的参数。 示例: -x UCG_PLANC_UCX_ALLREDUCE_NUM_NAP_GROUP=1 |
-x UCG_PLANC_UCX_BARRIER_NUM_NAP_GROUP= |
|
可选参数,Barrier算法的算法序号为10时的参数。 示例: -x UCG_PLANC_UCX_BARRIER_NUM_NAP_GROUP=1 |
-x UCG_PLANC_UCX_BCAST_ESBT_BLOCKS= |
|
可选参数,Bcast算法的算法序号为9时的参数。 示例: -x UCG_PLANC_UCX_BCAST_ESBT_BLOCKS=0 |
-x UCG_PLANC_UCX_ALLTOALLV_MIN_SEND_BATCH= |
|
可选参数,Alltoallv算法的算法序号为1时的参数,发送批处理模式的最小边界值。 示例: -x UCG_PLANC_UCX_ALLTOALLV_MIN_SEND_BATCH=0 |
-x UCG_PLANC_UCX_ALLTOALLV_MAX_SEND_BATCH= |
|
可选参数,Alltoallv算法的算法序号为1时的参数,发送批处理模式的最大边界值。 示例: -x UCG_PLANC_UCX_ALLTOALLV_MAX_SEND_BATCH=1 |
-x UCG_PLANC_UCX_REDUCE_CONSISTENCY= |
|
可选参数,UCG中Allreduce结果是否保证一致性。 示例: -x UCG_PLANC_UCX_REDUCE_CONSISTENCY=n |
--mca coll_ucg_priority |
|
可选参数,Hyper MPI调用UCG模块的优先级,值越大,优先级越高。 示例: --mca coll_ucg_priority 90 |
--mca coll_ucg_verbose |
|
可选参数,UCG组件的日志详细程度。 示例: --mca coll_ucg_verbose 2 |
--mca coll_ucg_max_rcache_size |
|
可选参数,coll ucg组件的请求cache大小。 示例: --mca coll_ucg_max_rcache_size 10 |
--mca coll_ucg_disable_coll |
|
可选参数,运行Hyper MPI作业时,禁用的Hyper MPI优化后的集合操作。 示例: --mca coll_ucg_disable_coll barrier,bcast |
--mca topo_tpm_enable |
|
可选参数,是否使用进程排布功能。 示例: --mca topo_tpm_enable 0 |
--mca pmix_pmix3x_wait_time |
|
可选参数,Client端进程等待Server端返回处理结果的时间。 示例: --mca pmix_pmix3x_wait_time 5 |
-x UCX_UD_VERBS_MIN_PENDING_TICK |
|
可选参数,调度器的最小挂起时间,防止UD VERBS协议下因调度器挂起导致误报超时。 示例: -x UCX_UD_VERBS_MIN_PENDING_TICK=2s |
-x UCX_UD_MLX5_MIN_PENDING_TICK |
|
可选参数,调度器的最小挂起时间,防止UD MLX5协议下因调度器挂起导致误报超时。 示例: -x UCX_UD_MLX5_MIN_PENDING_TICK=2s |
-x UCX_MIN_PENDING_TIME |
|
可选参数,调度器的最小挂起时间,防止ucp request超时检测中因调度器挂起导致误报超时。 示例: -x UCX_MIN_PENDING_TIME=2s |
-x UCX_REQ_TIMEOUT |
|
可选参数,ucp request超时检测的超时阈值,当点对点通信请求未完成时间超过该阈值时给出超时报警。 示例: -x UCX_REQ_TIMEOUT=100s |