本文介绍当前Hyper MPI 25.0.0及以上版本命令参数。

Hyper MPI 25.0.0及以上版本命令参数为在2.4.3及以上版本命令参数基础上新增的命令参数。

使用Hyper MPI命令参数指定算法时，可以参考算法地图了解具体参数值的含义。

Hyper MPI 25.0.0及以上版本命令参数	取值	参数说明
-x UCG_PLANC_STARS_TLS=	取值类型：string 取值范围： all rc_acc sdma_acc 默认值：all	可选参数，指定卸载算法所用的传输协议。示例： -x UCG_PLANC_STARS_TLS=all
-x UCG_PLANC_STARS_NET_DEVICES=	取值类型：string 取值范围：当前设备上所有网卡。默认值：all	可选参数，指定卸载算法所用的网卡。示例： -x UCG_PLANC_STARS_NET_DEVICES=all
-x UCG_PLANC_STARS_SELF_DEVICES=	取值类型：string 取值范围：memory 默认值：memory	可选参数，指定卸载算法所用的环回设备。示例： -x UCG_PLANC_STARS_SELF_DEVICES=memory
-x UCG_PLANC_STARS_MAX_RAILS=	取值类型：int 取值范围：1~9 默认值：1	可选参数，指定卸载算法最多使用的链路数。示例： -x UCG_PLANC_STARS_MAX_RAILS=1
-x UCG_PLANC_STARS_BCAST_ATTR=	取值类型：string，格式为I:id[S:scoreR:start-end]。取值范围： id：必填，1~4。 score：选填，任意自然数。 start：选填，任意自然数。 end：选填，任意自然数。默认值：无固定值，根据生效规则调节赋值。	可选参数，Bcast的算法参数。示例： -x UCG_PLANC_STARS_BCAST_ATTR=I:1
-x UCG_PLANC_STARS_IBCAST_ATTR=	取值类型：string，格式为I:id[S:scoreR:start-end]。取值范围： id：必填，1~4。 score：选填，任意自然数。 start：选填，任意自然数。 end：选填，任意自然数。默认值：无固定值，根据生效规则调节赋值。	可选参数，IBcast的算法参数。示例： -x UCG_PLANC_STARS_IBCAST_ATTR=I:1
-x UCG_PLANC_STARS_SCATTERV_ATTR=	取值类型：string，格式为I:id[S:scoreR:start-end]。取值范围： id：必填，1。 score：选填，任意自然数。 start：选填，任意自然数。 end：选填，任意自然数。默认值：无固定值，根据生效规则调节赋值。	可选参数，Scatterv的算法参数。示例： -x UCG_PLANC_STARS_SCATTERV_ATTR=I:1
-x UCG_PLANC_STARS_ISCTTERV_ATTR=	取值类型：string，格式为I:id[S:scoreR:start-end]。取值范围： id：必填，1。 score：选填，任意自然数。 start：选填，任意自然数。 end：选填，任意自然数。默认值：无固定值，根据生效规则调节赋值。	可选参数，IScatterv的算法参数。示例： -x UCG_PLANC_STARS_ISCATTERV_ATTR=I:1
-x UCG_PLANC_STARS_ALLGATHERV_ATTR=	取值类型：string，格式为I:id[S:scoreR:start-end]。取值范围： id：必填，1。 score：选填，任意自然数。 start：选填，任意自然数。 end：选填，任意自然数。默认值：无固定值，根据生效规则调节赋值。	可选参数，Allgatherv的算法参数。示例： -x UCG_PLANC_STARS_ALLGATHERV_ATTR=I:1
-x UCG_PLANC_STARS_IALLGATHERV_ATTR=	取值类型：string，格式为I:id[S:scoreR:start-end]。取值范围： id：必填，1。 score：选填，任意自然数。 start：选填，任意自然数。 end：选填，任意自然数。默认值：无固定值，根据生效规则调节赋值。	可选参数，IAllgatherv的算法参数。示例： -x UCG_PLANC_STARS_IALLGATHERV_ATTR=I:1
-x UCG_PLANC_STARS_ALLTOALLV_ATTR=	取值类型：string，格式为I:id[S:scoreR:start-end]。取值范围： id：必填，1。 score：选填，任意自然数。 start：选填，任意自然数。 end：选填，任意自然数。默认值：无固定值，根据生效规则调节赋值。	可选参数，Alltoallv的算法参数。示例： -x UCG_PLANC_STARS_ALLTOALLV_ATTR=I:1
-x UCG_PLANC_STARS_IALLTOALLV_ATTR=	取值类型：string，格式为I:id[S:scoreR:start-end]。取值范围： id：必填，1。 score：选填，任意自然数。 start：选填，任意自然数。 end：选填，任意自然数。默认值：无固定值，根据生效规则调节赋值。	可选参数，IAlltoallv的算法参数。示例： -x UCG_PLANC_STARS_IALLTOALLV_ATTR=I:1
-x UCG_PLANC_STARS_BARRIER_ATTR=	取值类型：string，格式为I:id[S:scoreR:start-end]。取值范围： id：必填，1。 score：选填，任意自然数。 start：选填，任意自然数。 end：选填，任意自然数。默认值：无固定值，根据生效规则调节赋值。	可选参数，Barrier的算法参数。示例： -x UCG_PLANC_STARS_BARRIER_ATTR=I:1
-x UCG_PLANC_STARS_IBARRIER_ATTR=	取值类型：string，格式为I:id[S:scoreR:start-end]。取值范围： id：必填，1。 score：选填，任意自然数。 start：选填，任意自然数。 end：选填，任意自然数。默认值：无固定值，根据生效规则调节赋值。	可选参数，IBarrier的算法参数。示例： -x UCG_PLANC_STARS_IBARRIER_ATTR=I:1
-x UCG_PLANC_STARS_SCATTERV_KNTREE_DEGREE=	取值类型：int 取值范围：任意正整数说明：建议配置为2~运行作业节点数量间的正整数，例如2~8。默认值：2	可选参数，指定Scatterv的算法参数。示例： -x UCG_PLANC_STARS_SCATTERV_KNTREE_DEGREE=2
-x UCG_PLANC_STARS_BARRIER_FANIN_DEGREE=	取值类型：int 取值范围：任意正整数说明：建议配置为2~运行作业节点数量间的正整数，例如2~8。默认值：4	可选参数，指定Barrier_faninfanout的算法参数。示例： -x UCG_PLANC_STARS_BARRIER_FANIN_DEGREE=4
-x UCG_PLANC_STARS_BARRIER_FANOUT_DEGREE=	取值类型：int 取值范围：任意正整数说明：建议配置为2~运行作业节点数量间的正整数，例如2~8。默认值：2	可选参数，指定Barrier_faninfanout的算法参数。示例： -x UCG_PLANC_STARS_BARRIER_FANOUT_DEGREE=2
-x UCG_PLANC_STARS_SCATTERV_RUN_HPL=	取值类型：string 取值范围： y：使用HPL模式运行。 n：使用通用模式运行。默认值：n	可选参数，指定Scatterv的运行模式。示例： -x UCG_PLANC_STARS_SCATTERV_RUN_HPL=y
-x UCG_PLANC_STARS_RC_SEG_SIZE=	取值类型：size_t 取值范围：0~2^64-1 默认值：8256	可选参数，设置弹性缓冲区大小。示例： -x UCG_PLANC_STARS_RC_SEG_SIZE=8256
-x UCG_PLANC_STARS_RC_TX_QUEUE_LEN=	取值类型：unsigned 取值范围：0~2^32-1 默认值：1024	可选参数，设置QP中发送队列的长度。示例： -x UCG_PLANC_STARS_RC_TX_QUEUE_LEN=1024
-x UCG_PLANC_STARS_RC_TX_MIN_INLINE=	取值类型：unsigned 取值范围：0~2^32-1 默认值：64	可选参数，设置在发送WQE时为内联数据保留的最小字节。示例： -x UCG_PLANC_STARS_RC_TX_MIN_INLINE=64
-x UCG_PLANC_STARS_RC_TX_INLINE_RESP=	取值类型：unsigned 取值范围：0~2^32-1 默认值：64	可选参数，设置在发送WQE时为内联响应保留的字节。对于足够小的响应，比如原子操作和small reads，都会被以内联方式接收。示例： -x UCG_PLANC_STARS_RC_TX_INLINE_RESP=64
-x UCG_PLANC_STARS_RC_HOP_LIMIT=	取值类型：unsigned 取值范围：0~2^32-1 默认值：255	可选参数，设置IB跳数限制/RoCEv2生存时间。应介于0和255之间。示例： -x UCG_PLANC_STARS_RC_HOP_LIMIT=255
-x UCG_PLANC_STARS_RC_PATH_MTU=	取值类型：unsigned 取值范围： default 512 1024 2048 4096 默认值：default	可选参数，设置路径最大传输单元。default表示将为设备选择最佳MTU。示例： -x UCG_PLANC_STARS_RC_PATH_MTU=1024
-x UCG_PLANC_STARS_RC_TIMEOUT=	取值类型：string，格式为<number>[s\|us\|ms\|ns] 取值范围：<number>为任意大于0的浮点数。默认值：1ms	可选参数，设置传输超时时间。示例： -x UCG_PLANC_STARS_RC_TIMEOUT=1ms
-x UCG_PLANC_STARS_RC_RETRY_COUNT=	取值类型：unsigned 取值范围：0~2^32-1 默认值：7	可选参数，设置传输重试次数。示例： -x UCG_PLANC_STARS_RC_RETRY_COUNT=7
-x UCG_PLANC_STARS_RC_RNR_TIMEOUT=	取值类型：string，格式为<number>[s\|us\|ms\|ns] 取值范围：<number>为任意大于0的浮点数。默认值：1ms	可选参数，设置RNR超时时间。示例： -x UCG_PLANC_STARS_RC_RNR_TIMEOUT=1ms
-x UCG_PLANC_STARS_RC_RNR_RETRY_COUNT=	取值类型：unsigned 取值范围：0~2^32-1 默认值：7	可选参数，设置RNR重试次数。示例： -x UCG_PLANC_STARS_RC_RNR_RETRY_COUNT=7
-x UCG_PLANC_STARS_RC_TX_CQ_MODERATION=	取值类型：unsigned 取值范围：0~2^32-1 默认值：64	可选参数，在不请求完成的情况下，允许发送WQE的最大数量。示例： -x UCG_PLANC_STARS_RC_TX_CQ_MODERATION=64
-x UCG_PLANC_STARS_RC_TX_CQ_LEN=	取值类型：unsigned 取值范围：0~2^32-1 默认值：4096	可选参数，设置发送完成队列的长度。这限制了未完成的信号发送的总数。示例： -x UCG_PLANC_STARS_RC_TX_CQ_LEN=4096
-x UCG_PLANC_STARS_RC_TX_MAX_WR=	取值类型：unsigned 取值范围：0~2^32-1 默认值：-1（即2^32-1）	可选参数，限制未完成的已发布工作请求的数量。实际限制为该值和TX队列长度之间的最小值。-1表示无限制。示例： -x UCG_PLANC_STARS_RC_TX_MAX_WR=-1
-x UCG_PLANC_STARS_IB_RCACHE_MEM_PRIO=	取值类型：unsigned 取值范围：0~2^32-1 默认值：1000	可选参数，指定注册缓存内存事件优先级。示例： -x UCG_PLANC_STARS_IB_RCACHE_MEM_PRIO=1000
-x UCG_PLANC_STARS_IB_RCACHE_OVERHEAD=	取值类型：string，格式为<number>[s\|us\|ms\|ns] 取值范围：<number>为任意大于0的浮点数。默认值：180ns	可选参数，指定注册缓存查找开销。示例： -x UCG_PLANC_STARS_IB_RCACHE_OVERHEAD=180ns
-x UCG_PLANC_STARS_IB_RCACHE_ADDR_ALIGN=	取值类型：unsigned 取值范围：0~2^32-1 默认值：64	可选参数，指定注册地址对齐缓存。必须为2的幂次方，且介于64和系统页面大小之间。示例： -x UCG_PLANC_STARS_IB_RCACHE_ADDR_ALIGN=64
-x UCG_PLANC_STARS_IB_REG_METHODS=	取值类型：string 取值范围： rcache：用户空间注册缓存。 odp：隐式按需分页。 direct：直接注册。可以输入多种取值，以英文逗号分割，例如rcache,odp。默认值：rcache,odp,direct	可选参数，设置不同优先级的注册MR的方法。示例： -x UCG_PLANC_STARS_IB_REG_METHODS=rcache,odp,direct
-x UCG_PLANC_STARS_IB_MEM_REG_OVERHEAD=	取值类型：string，格式为<number>[s\|us\|ms\|ns] 取值范围：<number>为任意大于0的浮点数。默认值：16us	可选参数，设置内存注册开销。示例： -x UCG_PLANC_STARS_IB_MEM_REG_OVERHEAD=16us
-x UCG_PLANC_STARS_IB_MEM_REG_GROWTH=	取值类型：string，格式为<number>[s\|us\|ms\|ns] 取值范围：<number>为任意大于0的浮点数。默认值：0.06ns	可选参数，设置内存注册增长率。示例： -x UCG_PLANC_STARS_IB_MEM_REG_GROWTH=0.1ns
-x UCG_PLANC_STARS_IB_ETH_PAUSE_ON=	取值类型：string 取值范围： y：在以太网上开启Pause帧。 n：在以太网上关闭Pause帧。默认值：y	可选参数，是否在以太网上启用Pause帧。Pause帧是一种在以太网家族计算机网络拥塞时暂时停止数据传输的机制。如果将此参数设置为“n”，则将取消IB传输资格，因为在与RoCE一起使用时，在有损结构上可能表现不佳。示例： -x UCG_PLANC_STARS_IB_ETH_PAUSE_ON=y
-x UCG_PLANC_STARS_IB_ODP_NUMA_POLICY=	取值类型：string 取值范围： default：不改变已有的策略。 prefered：设置为MPOL_PREFERRED模式。 bind：设置为MPOL_BIND模式。默认值：default	可选参数，设置重写ODP区域的NUMA策略，以避免额外的页迁移。 MPOL_PREFERRED模式设置优先分配的节点。内核将首先尝试从此节点分配页面，如果首选节点可用内存不足，则回落到其他节点。 MPOL_BIND模式指定一个严格的策略，限制内存分配给nodemask指定的节点。如果nodemask指定了多个节点，则页面分配将来自具有足够空闲内存的节点，并且优先是离分配节点最近的节点。示例： -x UCG_PLANC_STARS_IB_ODP_NUMA_POLICY=bind
-x UCG_PLANC_STARS_IB_ODP_MAX_SIZE=	取值类型：string 取值范围： auto：自动检测是否按需分页。 <number>[b\|kb\|mb\|gb]：设置按需分页的最大内存区域大小为某一具体值。<number>取值范围为0~2^64-1。默认值：auto	可选参数，设置启用按需分页的最大内存区域大小。示例： -x UCG_PLANC_STARS_IB_ODP_MAX_SIZE=16kb
-x UCG_PLANC_STARS_RC_ROCE_LOCAL_SUBNET=	取值类型：string 取值范围： y：接口子网内的地址可访问。 n：所有远程RoCEv2 IP地址可从任何端口访问。默认值：n	可选参数，使用每个网络设备的本地IP地址和子网掩码，对RoCEv2报文进行路由，用于筛选端口的IB子网前缀，为空表示不进行筛选。示例： -x UCG_PLANC_STARS_RC_ROCE_LOCAL_SUBNET=y
-x UCG_PLANC_STARS_RC_ROCE_LOCAL_SUBNET_PREFIX_LEN=	取值类型：string 取值范围： auto：自动从设备地址检测子网前缀长度。 inf：仅允许同一设备内的连接。 <num>：为子网前缀指定数字比特位长度值。取值范围为0~32。默认值：auto	可选参数，使能UCX_IB_ROCE_LOCAL_SUBNET时，用于可达性检查的子网前缀长度，单位为比特。示例： -x UCG_PLANC_STARS_RC_ROCE_LOCAL_SUBNET_PREFIX_LEN=8
-x UCG_PLANC_STARS_SDMA_BW=	取值类型：string，格式为<number>[T\|G\|M\|K]B\|b[[p\|/]s] 取值范围：<number>为任意大于0的浮点数。默认值：16911MBs	可选参数，配置SDMA的带宽，用于数据发送时控制SDMA链路的分包大小，仅在Multi-Rail场景下生效，单链路下配置无意义。示例： -x UCG_PLANC_STARS_SDMA_BW=10000MBs
-x UCX_RC_VERBS_TX_MIN_SGE=	取值类型：unsigned 取值范围：0~2^32-1 默认值：5	可选参数，在RC协议下发送WQE中要保留的SG条目数。示例： -x UCX_RC_VERBS_TX_MIN_SGE=2
-x UCX_UD_VERBS_TX_MIN_SGE=	取值类型：unsigned 取值范围：0~2^32-1 默认值：5	可选参数，在UD协议下发送WQE中要保留的SG条目数。示例： -x UCX_UD_VERBS_TX_MIN_SGE=1
-x UCX_SDMA_SHARED_CHANNEL_MODE=	取值类型：bool 取值范围： y：开启共享通道模式。 n：使用独立通道模式。默认值：y	可选参数，开启该功能后，支持SDMA使用共享通道。示例： -x UCX_SDMA_SHARED_CHANNEL_MODE=y
-x UCG_PLANC_STARS_STREAM_DEPTH=	取值类型：int 取值范围：4096~65535 默认值：4096	可选参数，指定卸载队列深度。示例： -x UCG_PLANC_STARS_STREAM_DEPTH=4096
-x UCG_PLANC_UCX_ALLGATHERV_DEFAULT_POLICY=	取值类型：bool 取值范围： y：使用默认算法。 n：使用优化算法。默认值：y	可选参数，指定Allgatherv算子使用优化算法（部分环境下可能不适用）。示例： -x UCG_PLANC_UCX_ALLGATHERV_DEFAULT_POLICY=y
-x UCG_PLANC_UCX_ALLTOALLV_DEFAULT_POLICY=	取值类型：bool 取值范围： y：使用默认算法。 n：使用优化算法。默认值：y	可选参数，指定Alltoallv算子使用优化算法（部分环境下可能不适用）。示例： -x UCG_PLANC_UCX_ALLTOALLV_DEFAULT_POLICY=y