中文
注册
我要评分
文档获取效率
文档正确性
内容完整性
文档易理解
在线提单
论坛求助
鲲鹏小智

Hyper MPI 1.2.*及以下版本命令参数

Hyper MPI在支持1.3.*版本命令参数的基础上兼容1.2.*及以下版本的命令参数。本文介绍Hyper MPI 1.2.*及以下版本的命令参数,1.2.*及以下版本的命令参数与1.3.*版本命令参数之间的生效规则和转换关系。

生效规则

  • 如果不对任何版本的命令参数进行手动赋值,则生效值为1.3.*版本命令参数的默认值。
  • 如果手动为Hyper MPI命令参数赋值,生效规则如表1所示。
    表1 生效规则

    1.3.*版本命令参数

    1.2.*及以下版本命令参数

    生效值

    合法

    不合法

    合法

    不合法

    -

    -

    1.3.*版本命令参数的值

    -

    -

    1.3.*版本命令参数的值

    -

    -

    1.2.*及以下版本命令参数的值

    -

    -

    1.3.*版本命令参数的默认值

    -

    -

    -

    1.3.*版本命令参数的值

    -

    -

    -

    1.3.*版本命令参数的默认值

    -

    -

    -

    1.2.*及以下版本命令参数的值

    -

    -

    -

    1.3.*版本命令参数的默认值

使用建议

  • Hyper MPI 1.2.*版本命令参数,Hyper MPI 1.3.*版本的命令参数可以提供更全面、更优的性能,建议使用Hyper MPI 1.3.*版本的命令参数。
  • 使用Hyper MPI命令参数指定算法时,可以参考算法地图了解具体参数值的含义。

命令参数及转换关系

表2 1.2.*及以下版本命令参数及其与1.3.*版本命令参数之间转换关系

Hyper MPI 1.2.*及以下版本命令参数

Hyper MPI 1.3.*版本命令参数

取值

参数说明

-x UCX_BUILTIN_DEGREE_INTER_FANOUT=

-x UCG_PLANC_UCX_ALLREDUCE_FANOUT_INTER_DEGREE=

  • 取值类型:int
  • 取值范围:任意正整数
    说明:

    建议配置为2~运行作业节点数量间的正整数。

  • 默认值:8

可选参数,表示算法使用的节点间K项树的扇出值。具体算法如下:

  • Allreduce算法的算法序号为7和8时的参数。
  • Barrier算法的算法序号为6和7时的参数。
  • Bcast算法的算法序号为4时的参数。

示例:

-x UCX_BUILTIN_DEGREE_INTER_FANOUT=8

-x UCG_PLANC_UCX_BARRIER_FANOUT_INTRA_DEGREE=

  • 取值类型:int
  • 取值范围:任意正整数
    说明:

    建议配置为2~参与通信进程数量间的正整数。

  • 默认值:8

-x UCG_PLANC_UCX_BCAST_NA_KNTREE_INTER_DEGREE=

  • 取值类型:int
  • 取值范围:任意正整数
    说明:

    建议配置为2~运行作业节点数量间的正整数。

  • 默认值:8

-x UCX_BUILTIN_DEGREE_INTER_FANIN=

-x UCG_PLANC_UCX_ALLREDUCE_FANIN_INTER_DEGREE=

  • 取值类型:int
  • 取值范围:任意正整数
    说明:

    建议配置为2~运行作业节点数量间的正整数。

  • 默认值:8

可选参数,表示算法使用的节点间K项树的扇入值。具体算法如下:

  • Allreduce算法的算法序号为7和8时的参数。
  • Barrier算法的算法序号为6和7时的参数。

示例:

-x UCX_BUILTIN_DEGREE_INTER_FANIN=8

-x UCG_PLANC_UCX_BARRIER_FANIN_INTER_DEGREE=

-x UCX_BUILTIN_DEGREE_INTRA_FANOUT=

-x UCG_PLANC_UCX_ALLREDUCE_FANOUT_INTRA_DEGREE=

  • 取值类型:int
  • 取值范围:任意正整数
    说明:

    建议配置为2~参与通信进程数量间的正整数。

  • 默认值:2

可选参数,表示算法使用的节点内K项树的扇出值。具体算法如下:

  • Allreduce算法的算法序号为5、6、7和8时的参数。
  • Barrier算法的算法序号为4、5、6和7时的参数。
  • Bcast算法的算法序号为3和4时的参数。

示例:

-x UCX_BUILTIN_DEGREE_INTRA_FANOUT=8

-x UCG_PLANC_UCX_BARRIER_FANOUT_INTRA_DEGREE=

-x UCG_PLANC_UCX_BCAST_NA_KNTREE_INTRA_DEGREE=

-x UCX_BUILTIN_DEGREE_INTRA_FANIN=

-x UCG_PLANC_UCX_ALLREDUCE_FANIN_INTRA_DEGREE=

  • 取值类型:int
  • 取值范围:任意正整数
    说明:

    建议配置为2~参与通信进程数量间的正整数。

  • 默认值:2

可选参数,表示算法使用的节点内K项树的扇入值。具体算法如下:

  • Allreduce算法的算法序号为5、6、7和8时的参数。
  • Barrier算法的算法序号为4、5、6和7时的参数。

示例:

-x UCX_BUILTIN_DEGREE_INTRA_FANIN=2

-x UCG_PLANC_UCX_BARRIER_FANIN_INTRA_DEGREE=

-x UCX_BUILTIN_BCAST_ALGORITHM=

-x UCG_PLANC_UCX_BCAST_ATTR=

  • 取值类型:int
  • 取值范围:1~5
  • 默认值:无固定值,根据生效规则调节赋值。

可选参数,用于选择Bcast算法序号的参数。

示例:

-x UCX_BUILTIN_BCAST_ALGORITHM=4

-x UCX_BUILTIN_ALLREDUCE_ALGORITHM=

-x UCG_PLANC_UCX_ALLREDUCE_ATTR=

  • 取值类型:int
  • 取值范围:1~14
  • 默认值:无固定值,根据生效规则调节赋值。

可选参数,用于选择Allreduce算法序号的参数。

示例:

-x UCX_BUILTIN_ALLREDUCE_ALGORITHM=7

-x UCX_BUILTIN_BARRIER_ALGORITHM=

-x UCG_PLANC_UCX_BARRIER_ATTR=

  • 取值类型:int
  • 取值范围:1~10
  • 默认值:无固定值,根据生效规则调节赋值。

可选参数,用于选择Barrier算法序号的参数。

示例:

-x UCX_BUILTIN_BARRIER_ALGORITHM=1

-x UCX_BUILTIN_MAX_MSG_LIST_SIZE=

-x UCG_PLANC_UCX_NPOLLS=

  • 取值类型:int
  • 取值范围:任意正整数
  • 默认值:40

可选参数,P2P请求测试UCP进度轮询周期数。

示例:

-x UCX_BUILTIN_MAX_MSG_LIST_SIZE=40

-x UCX_BUILTIN_REDUCE_CONSISTENCY=

-x UCG_PLANC_UCX_REDUCE_CONSISTENCY=

  • 取值类型:string
  • 取值范围:
    • y:保证allreduce结果一致性
    • n:不保证allreduce结果一致性
  • 默认值:n

可选参数,UCG中Allreduce结果是否保证一致性。

示例:

-x UCX_BUILTIN_REDUCE_CONSISTENCY=n