本文介绍当前Hyper MPI 25.0.0及以上版本命令参数。
Hyper MPI 25.0.0及以上版本命令参数为在2.4.3及以上版本命令参数基础上新增的命令参数。
使用Hyper MPI命令参数指定算法时,可以参考算法地图了解具体参数值的含义。
Hyper MPI 25.0.0及以上版本命令参数 |
取值 |
参数说明 |
---|---|---|
-x UCG_PLANC_STARS_TLS= |
|
可选参数,指定卸载算法所用的传输协议。 示例: -x UCG_PLANC_STARS_TLS=all |
-x UCG_PLANC_STARS_NET_DEVICES= |
|
可选参数,指定卸载算法所用的网卡。 示例: -x UCG_PLANC_STARS_NET_DEVICES=all |
-x UCG_PLANC_STARS_SELF_DEVICES= |
|
可选参数,指定卸载算法所用的环回设备。 示例: -x UCG_PLANC_STARS_SELF_DEVICES=memory |
-x UCG_PLANC_STARS_MAX_RAILS= |
|
可选参数,指定卸载算法最多使用的链路数。 示例: -x UCG_PLANC_STARS_MAX_RAILS=1 |
-x UCG_PLANC_STARS_BCAST_ATTR= |
|
可选参数,Bcast的算法参数。 示例: -x UCG_PLANC_STARS_BCAST_ATTR=I:1 |
-x UCG_PLANC_STARS_IBCAST_ATTR= |
|
可选参数,IBcast的算法参数。 示例: -x UCG_PLANC_STARS_IBCAST_ATTR=I:1 |
-x UCG_PLANC_STARS_SCATTERV_ATTR= |
|
可选参数,Scatterv的算法参数。 示例: -x UCG_PLANC_STARS_SCATTERV_ATTR=I:1 |
-x UCG_PLANC_STARS_ISCTTERV_ATTR= |
|
可选参数,IScatterv的算法参数。 示例: -x UCG_PLANC_STARS_ISCATTERV_ATTR=I:1 |
-x UCG_PLANC_STARS_ALLGATHERV_ATTR= |
|
可选参数,Allgatherv的算法参数。 示例: -x UCG_PLANC_STARS_ALLGATHERV_ATTR=I:1 |
-x UCG_PLANC_STARS_IALLGATHERV_ATTR= |
|
可选参数,IAllgatherv的算法参数。 示例: -x UCG_PLANC_STARS_IALLGATHERV_ATTR=I:1 |
-x UCG_PLANC_STARS_ALLTOALLV_ATTR= |
|
可选参数,Alltoallv的算法参数。 示例: -x UCG_PLANC_STARS_ALLTOALLV_ATTR=I:1 |
-x UCG_PLANC_STARS_IALLTOALLV_ATTR= |
|
可选参数,IAlltoallv的算法参数。 示例: -x UCG_PLANC_STARS_IALLTOALLV_ATTR=I:1 |
-x UCG_PLANC_STARS_BARRIER_ATTR= |
|
可选参数,Barrier的算法参数。 示例: -x UCG_PLANC_STARS_BARRIER_ATTR=I:1 |
-x UCG_PLANC_STARS_IBARRIER_ATTR= |
|
可选参数,IBarrier的算法参数。 示例: -x UCG_PLANC_STARS_IBARRIER_ATTR=I:1 |
-x UCG_PLANC_STARS_SCATTERV_KNTREE_DEGREE= |
|
可选参数,指定Scatterv的算法参数。 示例: -x UCG_PLANC_STARS_SCATTERV_KNTREE_DEGREE=2 |
-x UCG_PLANC_STARS_BARRIER_FANIN_DEGREE= |
|
可选参数,指定Barrier_faninfanout的算法参数。 示例: -x UCG_PLANC_STARS_BARRIER_FANIN_DEGREE=4 |
-x UCG_PLANC_STARS_BARRIER_FANOUT_DEGREE= |
|
可选参数,指定Barrier_faninfanout的算法参数。 示例: -x UCG_PLANC_STARS_BARRIER_FANOUT_DEGREE=2 |
-x UCG_PLANC_STARS_SCATTERV_RUN_HPL= |
|
可选参数,指定Scatterv的运行模式。 示例: -x UCG_PLANC_STARS_SCATTERV_RUN_HPL=y |
-x UCG_PLANC_STARS_RC_SEG_SIZE= |
|
可选参数,设置弹性缓冲区大小。 示例: -x UCG_PLANC_STARS_RC_SEG_SIZE=8256 |
-x UCG_PLANC_STARS_RC_TX_QUEUE_LEN= |
|
可选参数,设置QP中发送队列的长度。 示例: -x UCG_PLANC_STARS_RC_TX_QUEUE_LEN=1024 |
-x UCG_PLANC_STARS_RC_TX_MIN_INLINE= |
|
可选参数,设置在发送WQE时为内联数据保留的最小字节。 示例: -x UCG_PLANC_STARS_RC_TX_MIN_INLINE=64 |
-x UCG_PLANC_STARS_RC_TX_INLINE_RESP= |
|
可选参数,设置在发送WQE时为内联响应保留的字节。对于足够小的响应,比如原子操作和small reads,都会被以内联方式接收。 示例: -x UCG_PLANC_STARS_RC_TX_INLINE_RESP=64 |
-x UCG_PLANC_STARS_RC_HOP_LIMIT= |
|
可选参数,设置IB跳数限制/RoCEv2生存时间。应介于0和255之间。 示例: -x UCG_PLANC_STARS_RC_HOP_LIMIT=255 |
-x UCG_PLANC_STARS_RC_PATH_MTU= |
|
可选参数,设置路径最大传输单元。default表示将为设备选择最佳MTU。 示例: -x UCG_PLANC_STARS_RC_PATH_MTU=1024 |
-x UCG_PLANC_STARS_RC_TIMEOUT= |
|
可选参数,设置传输超时时间。 示例: -x UCG_PLANC_STARS_RC_TIMEOUT=1ms |
-x UCG_PLANC_STARS_RC_RETRY_COUNT= |
|
可选参数,设置传输重试次数。 示例: -x UCG_PLANC_STARS_RC_RETRY_COUNT=7 |
-x UCG_PLANC_STARS_RC_RNR_TIMEOUT= |
|
可选参数,设置RNR超时时间。 示例: -x UCG_PLANC_STARS_RC_RNR_TIMEOUT=1ms |
-x UCG_PLANC_STARS_RC_RNR_RETRY_COUNT= |
|
可选参数,设置RNR重试次数。 示例: -x UCG_PLANC_STARS_RC_RNR_RETRY_COUNT=7 |
-x UCG_PLANC_STARS_RC_TX_CQ_MODERATION= |
|
可选参数,在不请求完成的情况下,允许发送WQE的最大数量。 示例: -x UCG_PLANC_STARS_RC_TX_CQ_MODERATION=64 |
-x UCG_PLANC_STARS_RC_TX_CQ_LEN= |
|
可选参数,设置发送完成队列的长度。这限制了未完成的信号发送的总数。 示例: -x UCG_PLANC_STARS_RC_TX_CQ_LEN=4096 |
-x UCG_PLANC_STARS_RC_TX_MAX_WR= |
|
可选参数,限制未完成的已发布工作请求的数量。实际限制为该值和TX队列长度之间的最小值。-1表示无限制。 示例: -x UCG_PLANC_STARS_RC_TX_MAX_WR=-1 |
-x UCG_PLANC_STARS_IB_RCACHE_MEM_PRIO= |
|
可选参数,指定注册缓存内存事件优先级。 示例: -x UCG_PLANC_STARS_IB_RCACHE_MEM_PRIO=1000 |
-x UCG_PLANC_STARS_IB_RCACHE_OVERHEAD= |
|
可选参数,指定注册缓存查找开销。 示例: -x UCG_PLANC_STARS_IB_RCACHE_OVERHEAD=180ns |
-x UCG_PLANC_STARS_IB_RCACHE_ADDR_ALIGN= |
|
可选参数,指定注册地址对齐缓存。必须为2的幂次方,且介于64和系统页面大小之间。 示例: -x UCG_PLANC_STARS_IB_RCACHE_ADDR_ALIGN=64 |
-x UCG_PLANC_STARS_IB_REG_METHODS= |
|
可选参数,设置不同优先级的注册MR的方法。 示例: -x UCG_PLANC_STARS_IB_REG_METHODS=rcache,odp,direct |
-x UCG_PLANC_STARS_IB_MEM_REG_OVERHEAD= |
|
可选参数,设置内存注册开销。 示例: -x UCG_PLANC_STARS_IB_MEM_REG_OVERHEAD=16us |
-x UCG_PLANC_STARS_IB_MEM_REG_GROWTH= |
|
可选参数,设置内存注册增长率。 示例: -x UCG_PLANC_STARS_IB_MEM_REG_GROWTH=0.1ns |
-x UCG_PLANC_STARS_IB_ETH_PAUSE_ON= |
|
可选参数,是否在以太网上启用Pause帧。Pause帧是一种在以太网家族计算机网络拥塞时暂时停止数据传输的机制。如果将此参数设置为“n”,则将取消IB传输资格,因为在与RoCE一起使用时,在有损结构上可能表现不佳。 示例: -x UCG_PLANC_STARS_IB_ETH_PAUSE_ON=y |
-x UCG_PLANC_STARS_IB_ODP_NUMA_POLICY= |
|
可选参数,设置重写ODP区域的NUMA策略,以避免额外的页迁移。
示例: -x UCG_PLANC_STARS_IB_ODP_NUMA_POLICY=bind |
-x UCG_PLANC_STARS_IB_ODP_MAX_SIZE= |
|
可选参数,设置启用按需分页的最大内存区域大小。 示例: -x UCG_PLANC_STARS_IB_ODP_MAX_SIZE=16kb |
-x UCG_PLANC_STARS_RC_ROCE_LOCAL_SUBNET= |
|
可选参数,使用每个网络设备的本地IP地址和子网掩码,对RoCEv2报文进行路由,用于筛选端口的IB子网前缀,为空表示不进行筛选。 示例: -x UCG_PLANC_STARS_RC_ROCE_LOCAL_SUBNET=y |
-x UCG_PLANC_STARS_RC_ROCE_LOCAL_SUBNET_PREFIX_LEN= |
|
可选参数,使能UCX_IB_ROCE_LOCAL_SUBNET时,用于可达性检查的子网前缀长度,单位为比特。 示例: -x UCG_PLANC_STARS_RC_ROCE_LOCAL_SUBNET_PREFIX_LEN=8 |
-x UCG_PLANC_STARS_SDMA_BW= |
|
可选参数,配置SDMA的带宽,用于数据发送时控制SDMA链路的分包大小,仅在Multi-Rail场景下生效,单链路下配置无意义。 示例: -x UCG_PLANC_STARS_SDMA_BW=10000MBs |
-x UCX_RC_VERBS_TX_MIN_SGE= |
|
可选参数,在RC协议下发送WQE中要保留的SG条目数。 示例: -x UCX_RC_VERBS_TX_MIN_SGE=2 |
-x UCX_UD_VERBS_TX_MIN_SGE= |
|
可选参数,在UD协议下发送WQE中要保留的SG条目数。 示例: -x UCX_UD_VERBS_TX_MIN_SGE=1 |
-x UCX_SDMA_SHARED_CHANNEL_MODE= |
|
可选参数,开启该功能后,支持SDMA使用共享通道。 示例: -x UCX_SDMA_SHARED_CHANNEL_MODE=y |
-x UCG_PLANC_STARS_STREAM_DEPTH= |
|
可选参数,指定卸载队列深度。 示例: -x UCG_PLANC_STARS_STREAM_DEPTH=4096 |
-x UCG_PLANC_UCX_ALLGATHERV_DEFAULT_POLICY= |
|
可选参数,指定Allgatherv算子使用优化算法(部分环境下可能不适用)。 示例: -x UCG_PLANC_UCX_ALLGATHERV_DEFAULT_POLICY=y |
-x UCG_PLANC_UCX_ALLTOALLV_DEFAULT_POLICY= |
|
可选参数,指定Alltoallv算子使用优化算法(部分环境下可能不适用)。 示例: -x UCG_PLANC_UCX_ALLTOALLV_DEFAULT_POLICY=y |