Hyper MPI 25.0.0及以上版本命令参数

本文介绍当前Hyper MPI 25.0.0及以上版本命令参数。

Hyper MPI 25.0.0及以上版本命令参数为在2.4.3及以上版本命令参数基础上新增的命令参数。

使用Hyper MPI命令参数指定算法时,可以参考算法地图了解具体参数值的含义。

表1 Hyper MPI 25.0.0及以上版本命令参数

Hyper MPI 25.0.0及以上版本命令参数

取值

参数说明

-x UCG_PLANC_STARS_TLS=

  • 取值类型:string
  • 取值范围:
    • all
    • rc_acc
    • sdma_acc
  • 默认值:all

可选参数,指定卸载算法所用的传输协议。

示例:

-x UCG_PLANC_STARS_TLS=all

-x UCG_PLANC_STARS_NET_DEVICES=

  • 取值类型:string
  • 取值范围:当前设备上所有网卡。
  • 默认值:all

可选参数,指定卸载算法所用的网卡。

示例:

-x UCG_PLANC_STARS_NET_DEVICES=all

-x UCG_PLANC_STARS_SELF_DEVICES=

  • 取值类型:string
  • 取值范围:memory
  • 默认值:memory

可选参数,指定卸载算法所用的环回设备。

示例:

-x UCG_PLANC_STARS_SELF_DEVICES=memory

-x UCG_PLANC_STARS_MAX_RAILS=

  • 取值类型:int
  • 取值范围:1~9
  • 默认值:1

可选参数,指定卸载算法最多使用的链路数。

示例:

-x UCG_PLANC_STARS_MAX_RAILS=1

-x UCG_PLANC_STARS_BCAST_ATTR=

  • 取值类型:string,格式为I:id[S:scoreR:start-end]。
  • 取值范围:
    • id:必填,1~4。
    • score:选填,任意自然数。
    • start:选填,任意自然数。
    • end:选填,任意自然数。
  • 默认值:无固定值,根据生效规则调节赋值。

可选参数,Bcast的算法参数。

示例:

-x UCG_PLANC_STARS_BCAST_ATTR=I:1

-x UCG_PLANC_STARS_IBCAST_ATTR=

  • 取值类型:string,格式为I:id[S:scoreR:start-end]。
  • 取值范围:
    • id:必填,1~4。
    • score:选填,任意自然数。
    • start:选填,任意自然数。
    • end:选填,任意自然数。
  • 默认值:无固定值,根据生效规则调节赋值。

可选参数,IBcast的算法参数。

示例:

-x UCG_PLANC_STARS_IBCAST_ATTR=I:1

-x UCG_PLANC_STARS_SCATTERV_ATTR=

  • 取值类型:string,格式为I:id[S:scoreR:start-end]。
  • 取值范围:
    • id:必填,1。
    • score:选填,任意自然数。
    • start:选填,任意自然数。
    • end:选填,任意自然数。
  • 默认值:无固定值,根据生效规则调节赋值。

可选参数,Scatterv的算法参数。

示例:

-x UCG_PLANC_STARS_SCATTERV_ATTR=I:1

-x UCG_PLANC_STARS_ISCTTERV_ATTR=

  • 取值类型:string,格式为I:id[S:scoreR:start-end]。
  • 取值范围:
    • id:必填,1。
    • score:选填,任意自然数。
    • start:选填,任意自然数。
    • end:选填,任意自然数。
  • 默认值:无固定值,根据生效规则调节赋值。

可选参数,IScatterv的算法参数。

示例:

-x UCG_PLANC_STARS_ISCATTERV_ATTR=I:1

-x UCG_PLANC_STARS_ALLGATHERV_ATTR=

  • 取值类型:string,格式为I:id[S:scoreR:start-end]。
  • 取值范围:
    • id:必填,1。
    • score:选填,任意自然数。
    • start:选填,任意自然数。
    • end:选填,任意自然数。
  • 默认值:无固定值,根据生效规则调节赋值。

可选参数,Allgatherv的算法参数。

示例:

-x UCG_PLANC_STARS_ALLGATHERV_ATTR=I:1

-x UCG_PLANC_STARS_IALLGATHERV_ATTR=

  • 取值类型:string,格式为I:id[S:scoreR:start-end]。
  • 取值范围:
    • id:必填,1。
    • score:选填,任意自然数。
    • start:选填,任意自然数。
    • end:选填,任意自然数。
  • 默认值:无固定值,根据生效规则调节赋值。

可选参数,IAllgatherv的算法参数。

示例:

-x UCG_PLANC_STARS_IALLGATHERV_ATTR=I:1

-x UCG_PLANC_STARS_ALLTOALLV_ATTR=

  • 取值类型:string,格式为I:id[S:scoreR:start-end]。
  • 取值范围:
    • id:必填,1。
    • score:选填,任意自然数。
    • start:选填,任意自然数。
    • end:选填,任意自然数。
  • 默认值:无固定值,根据生效规则调节赋值。

可选参数,Alltoallv的算法参数。

示例:

-x UCG_PLANC_STARS_ALLTOALLV_ATTR=I:1

-x UCG_PLANC_STARS_IALLTOALLV_ATTR=

  • 取值类型:string,格式为I:id[S:scoreR:start-end]。
  • 取值范围:
    • id:必填,1。
    • score:选填,任意自然数。
    • start:选填,任意自然数。
    • end:选填,任意自然数。
  • 默认值:无固定值,根据生效规则调节赋值。

可选参数,IAlltoallv的算法参数。

示例:

-x UCG_PLANC_STARS_IALLTOALLV_ATTR=I:1

-x UCG_PLANC_STARS_BARRIER_ATTR=

  • 取值类型:string,格式为I:id[S:scoreR:start-end]。
  • 取值范围:
    • id:必填,1。
    • score:选填,任意自然数。
    • start:选填,任意自然数。
    • end:选填,任意自然数。
  • 默认值:无固定值,根据生效规则调节赋值。

可选参数,Barrier的算法参数。

示例:

-x UCG_PLANC_STARS_BARRIER_ATTR=I:1

-x UCG_PLANC_STARS_IBARRIER_ATTR=

  • 取值类型:string,格式为I:id[S:scoreR:start-end]。
  • 取值范围:
    • id:必填,1。
    • score:选填,任意自然数。
    • start:选填,任意自然数。
    • end:选填,任意自然数。
  • 默认值:无固定值,根据生效规则调节赋值。

可选参数,IBarrier的算法参数。

示例:

-x UCG_PLANC_STARS_IBARRIER_ATTR=I:1

-x UCG_PLANC_STARS_SCATTERV_KNTREE_DEGREE=

  • 取值类型:int
  • 取值范围:任意正整数
    说明:

    建议配置为2~运行作业节点数量间的正整数,例如2~8。

  • 默认值:2

可选参数,指定Scatterv的算法参数。

示例:

-x UCG_PLANC_STARS_SCATTERV_KNTREE_DEGREE=2

-x UCG_PLANC_STARS_BARRIER_FANIN_DEGREE=

  • 取值类型:int
  • 取值范围:任意正整数
    说明:

    建议配置为2~运行作业节点数量间的正整数,例如2~8。

  • 默认值:4

可选参数,指定Barrier_faninfanout的算法参数。

示例:

-x UCG_PLANC_STARS_BARRIER_FANIN_DEGREE=4

-x UCG_PLANC_STARS_BARRIER_FANOUT_DEGREE=

  • 取值类型:int
  • 取值范围:任意正整数
    说明:

    建议配置为2~运行作业节点数量间的正整数,例如2~8。

  • 默认值:2

可选参数,指定Barrier_faninfanout的算法参数。

示例:

-x UCG_PLANC_STARS_BARRIER_FANOUT_DEGREE=2

-x UCG_PLANC_STARS_SCATTERV_RUN_HPL=

  • 取值类型:string
  • 取值范围:
    • y:使用HPL模式运行。
    • n:使用通用模式运行。
  • 默认值:n

可选参数,指定Scatterv的运行模式。

示例:

-x UCG_PLANC_STARS_SCATTERV_RUN_HPL=y

-x UCG_PLANC_STARS_RC_SEG_SIZE=

  • 取值类型:size_t
  • 取值范围:0~2^64-1
  • 默认值:8256

可选参数,设置弹性缓冲区大小。

示例:

-x UCG_PLANC_STARS_RC_SEG_SIZE=8256

-x UCG_PLANC_STARS_RC_TX_QUEUE_LEN=

  • 取值类型:unsigned
  • 取值范围:0~2^32-1
  • 默认值:1024

可选参数,设置QP中发送队列的长度。

示例:

-x UCG_PLANC_STARS_RC_TX_QUEUE_LEN=1024

-x UCG_PLANC_STARS_RC_TX_MIN_INLINE=

  • 取值类型:unsigned
  • 取值范围:0~2^32-1
  • 默认值:64

可选参数,设置在发送WQE时为内联数据保留的最小字节。

示例:

-x UCG_PLANC_STARS_RC_TX_MIN_INLINE=64

-x UCG_PLANC_STARS_RC_TX_INLINE_RESP=

  • 取值类型:unsigned
  • 取值范围:0~2^32-1
  • 默认值:64

可选参数,设置在发送WQE时为内联响应保留的字节。对于足够小的响应,比如原子操作和small reads,都会被以内联方式接收。

示例:

-x UCG_PLANC_STARS_RC_TX_INLINE_RESP=64

-x UCG_PLANC_STARS_RC_HOP_LIMIT=

  • 取值类型:unsigned
  • 取值范围:0~2^32-1
  • 默认值:255

可选参数,设置IB跳数限制/RoCEv2生存时间。应介于0和255之间。

示例:

-x UCG_PLANC_STARS_RC_HOP_LIMIT=255

-x UCG_PLANC_STARS_RC_PATH_MTU=

  • 取值类型:unsigned
  • 取值范围:
    • default
    • 512
    • 1024
    • 2048
    • 4096
  • 默认值:default

可选参数,设置路径最大传输单元。default表示将为设备选择最佳MTU。

示例:

-x UCG_PLANC_STARS_RC_PATH_MTU=1024

-x UCG_PLANC_STARS_RC_TIMEOUT=

  • 取值类型:string,格式为<number>[s|us|ms|ns]
  • 取值范围:<number>为任意大于0的浮点数。
  • 默认值:1ms

可选参数,设置传输超时时间。

示例:

-x UCG_PLANC_STARS_RC_TIMEOUT=1ms

-x UCG_PLANC_STARS_RC_RETRY_COUNT=

  • 取值类型:unsigned
  • 取值范围:0~2^32-1
  • 默认值:7

可选参数,设置传输重试次数。

示例:

-x UCG_PLANC_STARS_RC_RETRY_COUNT=7

-x UCG_PLANC_STARS_RC_RNR_TIMEOUT=

  • 取值类型:string,格式为<number>[s|us|ms|ns]
  • 取值范围:<number>为任意大于0的浮点数。
  • 默认值:1ms

可选参数,设置RNR超时时间。

示例:

-x UCG_PLANC_STARS_RC_RNR_TIMEOUT=1ms

-x UCG_PLANC_STARS_RC_RNR_RETRY_COUNT=

  • 取值类型:unsigned
  • 取值范围:0~2^32-1
  • 默认值:7

可选参数,设置RNR重试次数。

示例:

-x UCG_PLANC_STARS_RC_RNR_RETRY_COUNT=7

-x UCG_PLANC_STARS_RC_TX_CQ_MODERATION=

  • 取值类型:unsigned
  • 取值范围:0~2^32-1
  • 默认值:64

可选参数,在不请求完成的情况下,允许发送WQE的最大数量。

示例:

-x UCG_PLANC_STARS_RC_TX_CQ_MODERATION=64

-x UCG_PLANC_STARS_RC_TX_CQ_LEN=

  • 取值类型:unsigned
  • 取值范围:0~2^32-1
  • 默认值:4096

可选参数,设置发送完成队列的长度。这限制了未完成的信号发送的总数。

示例:

-x UCG_PLANC_STARS_RC_TX_CQ_LEN=4096

-x UCG_PLANC_STARS_RC_TX_MAX_WR=

  • 取值类型:unsigned
  • 取值范围:0~2^32-1
  • 默认值:-1(即2^32-1)

可选参数,限制未完成的已发布工作请求的数量。实际限制为该值和TX队列长度之间的最小值。-1表示无限制。

示例:

-x UCG_PLANC_STARS_RC_TX_MAX_WR=-1

-x UCG_PLANC_STARS_IB_RCACHE_MEM_PRIO=

  • 取值类型:unsigned
  • 取值范围:0~2^32-1
  • 默认值:1000

可选参数,指定注册缓存内存事件优先级。

示例:

-x UCG_PLANC_STARS_IB_RCACHE_MEM_PRIO=1000

-x UCG_PLANC_STARS_IB_RCACHE_OVERHEAD=

  • 取值类型:string,格式为<number>[s|us|ms|ns]
  • 取值范围:<number>为任意大于0的浮点数。
  • 默认值:180ns

可选参数,指定注册缓存查找开销。

示例:

-x UCG_PLANC_STARS_IB_RCACHE_OVERHEAD=180ns

-x UCG_PLANC_STARS_IB_RCACHE_ADDR_ALIGN=

  • 取值类型:unsigned
  • 取值范围:0~2^32-1
  • 默认值:64

可选参数,指定注册地址对齐缓存。必须为2的幂次方,且介于64和系统页面大小之间。

示例:

-x UCG_PLANC_STARS_IB_RCACHE_ADDR_ALIGN=64

-x UCG_PLANC_STARS_IB_REG_METHODS=

  • 取值类型:string
  • 取值范围:
    • rcache:用户空间注册缓存。
    • odp:隐式按需分页。
    • direct:直接注册。

    可以输入多种取值,以英文逗号分割,例如rcache,odp。

  • 默认值:rcache,odp,direct

可选参数,设置不同优先级的注册MR的方法。

示例:

-x UCG_PLANC_STARS_IB_REG_METHODS=rcache,odp,direct

-x UCG_PLANC_STARS_IB_MEM_REG_OVERHEAD=

  • 取值类型:string,格式为<number>[s|us|ms|ns]
  • 取值范围:<number>为任意大于0的浮点数。
  • 默认值:16us

可选参数,设置内存注册开销。

示例:

-x UCG_PLANC_STARS_IB_MEM_REG_OVERHEAD=16us

-x UCG_PLANC_STARS_IB_MEM_REG_GROWTH=

  • 取值类型:string,格式为<number>[s|us|ms|ns]
  • 取值范围:<number>为任意大于0的浮点数。
  • 默认值:0.06ns

可选参数,设置内存注册增长率。

示例:

-x UCG_PLANC_STARS_IB_MEM_REG_GROWTH=0.1ns

-x UCG_PLANC_STARS_IB_ETH_PAUSE_ON=

  • 取值类型:string
  • 取值范围:
    • y:在以太网上开启Pause帧。
    • n:在以太网上关闭Pause帧。
  • 默认值:y

可选参数,是否在以太网上启用Pause帧。Pause帧是一种在以太网家族计算机网络拥塞时暂时停止数据传输的机制。如果将此参数设置为“n”,则将取消IB传输资格,因为在与RoCE一起使用时,在有损结构上可能表现不佳。

示例:

-x UCG_PLANC_STARS_IB_ETH_PAUSE_ON=y

-x UCG_PLANC_STARS_IB_ODP_NUMA_POLICY=

  • 取值类型:string
  • 取值范围:
    • default:不改变已有的策略。
    • prefered:设置为MPOL_PREFERRED模式。
    • bind:设置为MPOL_BIND模式。
  • 默认值:default

可选参数,设置重写ODP区域的NUMA策略,以避免额外的页迁移。

  • MPOL_PREFERRED模式设置优先分配的节点。内核将首先尝试从此节点分配页面,如果首选节点可用内存不足,则回落到其他节点。
  • MPOL_BIND模式指定一个严格的策略,限制内存分配给nodemask指定的节点。 如果nodemask指定了多个节点,则页面分配将来自具有足够空闲内存的节点,并且优先是离分配节点最近的节点。

示例:

-x UCG_PLANC_STARS_IB_ODP_NUMA_POLICY=bind

-x UCG_PLANC_STARS_IB_ODP_MAX_SIZE=

  • 取值类型:string
  • 取值范围:
    • auto:自动检测是否按需分页。
    • <number>[b|kb|mb|gb]:设置按需分页的最大内存区域大小为某一具体值。<number>取值范围为0~2^64-1。
  • 默认值:auto

可选参数,设置启用按需分页的最大内存区域大小。

示例:

-x UCG_PLANC_STARS_IB_ODP_MAX_SIZE=16kb

-x UCG_PLANC_STARS_RC_ROCE_LOCAL_SUBNET=

  • 取值类型:string
  • 取值范围:
    • y:接口子网内的地址可访问。
    • n:所有远程RoCEv2 IP地址可从任何端口访问。
  • 默认值:n

可选参数,使用每个网络设备的本地IP地址和子网掩码,对RoCEv2报文进行路由,用于筛选端口的IB子网前缀,为空表示不进行筛选。

示例:

-x UCG_PLANC_STARS_RC_ROCE_LOCAL_SUBNET=y

-x UCG_PLANC_STARS_RC_ROCE_LOCAL_SUBNET_PREFIX_LEN=

  • 取值类型:string
  • 取值范围:
    • auto:自动从设备地址检测子网前缀长度。
    • inf:仅允许同一设备内的连接。
    • <num>:为子网前缀指定数字比特位长度值。取值范围为0~32。
  • 默认值:auto

可选参数,使能UCX_IB_ROCE_LOCAL_SUBNET时,用于可达性检查的子网前缀长度,单位为比特。

示例:

-x UCG_PLANC_STARS_RC_ROCE_LOCAL_SUBNET_PREFIX_LEN=8

-x UCG_PLANC_STARS_SDMA_BW=

  • 取值类型:string,格式为<number>[T|G|M|K]B|b[[p|/]s]
  • 取值范围:<number>为任意大于0的浮点数。
  • 默认值:16911MBs

可选参数,配置SDMA的带宽,用于数据发送时控制SDMA链路的分包大小,仅在Multi-Rail场景下生效,单链路下配置无意义。

示例:

-x UCG_PLANC_STARS_SDMA_BW=10000MBs

-x UCX_RC_VERBS_TX_MIN_SGE=

  • 取值类型:unsigned
  • 取值范围:0~2^32-1
  • 默认值:5

可选参数,在RC协议下发送WQE中要保留的SG条目数。

示例:

-x UCX_RC_VERBS_TX_MIN_SGE=2

-x UCX_UD_VERBS_TX_MIN_SGE=

  • 取值类型:unsigned
  • 取值范围:0~2^32-1
  • 默认值:5

可选参数,在UD协议下发送WQE中要保留的SG条目数。

示例:

-x UCX_UD_VERBS_TX_MIN_SGE=1

-x UCX_SDMA_SHARED_CHANNEL_MODE=

  • 取值类型:bool
  • 取值范围:
    • y:开启共享通道模式。
    • n:使用独立通道模式。
  • 默认值:y

可选参数,开启该功能后,支持SDMA使用共享通道。

示例:

-x UCX_SDMA_SHARED_CHANNEL_MODE=y

-x UCG_PLANC_STARS_STREAM_DEPTH=

  • 取值类型:int
  • 取值范围:4096~65535
  • 默认值:4096

可选参数,指定卸载队列深度。

示例:

-x UCG_PLANC_STARS_STREAM_DEPTH=4096

-x UCG_PLANC_UCX_ALLGATHERV_DEFAULT_POLICY=

  • 取值类型:bool
  • 取值范围:
    • y:使用默认算法。
    • n:使用优化算法。
  • 默认值:y

可选参数,指定Allgatherv算子使用优化算法(部分环境下可能不适用)。

示例:

-x UCG_PLANC_UCX_ALLGATHERV_DEFAULT_POLICY=y

-x UCG_PLANC_UCX_ALLTOALLV_DEFAULT_POLICY=

  • 取值类型:bool
  • 取值范围:
    • y:使用默认算法。
    • n:使用优化算法。
  • 默认值:y

可选参数,指定Alltoallv算子使用优化算法(部分环境下可能不适用)。

示例:

-x UCG_PLANC_UCX_ALLTOALLV_DEFAULT_POLICY=y