中文
注册
我要评分
文档获取效率
文档正确性
内容完整性
文档易理解
在线提单
论坛求助

环境变量配置

以下环境变量会用于应用数学库中:

表1 通用环境变量说明

环境变量名:

变量意义:

有效值:

默认值

HGEMM_F16F16F32_MAX_KB

设置hgemm最大kb数

整数

1'000'000'000'000L

KML_SCADSS_VARIANT

scadss调度策略

整数(0|1),默认0

0

KSCALAPACK_REDIST_TO_LOCAL_APPLICABLE

scalapack本地内存适配

O\D\F

D

KML_NUM_THREADS

local线程数设置

整数

0

KML_THREAD_USING_POLICY

线程使用策略

整数

2

KML_CFMA_ACCELERATION

使用CFMA加速复数

整数

0

KML_SKIP_ZEROS

使用GEMM的skip-zeros模式加速零较多的矩阵乘

整数

1

KML_GEMM_TO_GEMM3M

使用GMEMM3M

整数

0

KML_ALLOCATE_POLICY

alloc规则

整数

0

KML_ALLOCATE_HUGEPAGE_SIZE

alloc大页规模

整数

512*1024*1024

KML_PXGETRF_FORCE_CALU

pgetrf函数使用CALU算法

整数

0

KML_FAST_EIGENSOLVER

使用高性能版本特征值求解器

整数

1

KML_TSQR_CHECK

对于高瘦型QR分解进行结果检查

整数

0

KML_MPI_USE_SHARED_MEMORY

MPI使用共享内存

整数

1

OMP_PLACES

OMP内置参数

cores

-

OMP_PROC_BIND

OMP内置参数

TRUE

-

KML_VERBOSE

打印等级

0/1/2/3

0

表2 KML_DSS环境变量说明

环境变量名:

变量意义:

有效值:

默认值

KML_DSS_SCHE_MODE

DSS调度模式

STATIC\DYNAMIC\KPCCL\LAST

LAST

KML_DSS_SGEMM_ISA

求解器内部SGEMM选择合适的算子优化分支

NEON\SVE256

通过机型判断

KML_DSS_DGEMM_ISA

求解器内部DGEMM选择合适的算子优化分支

NEON\SVE256

通过机型判断

KML_DSS_CGEMM_ISA

求解器内部CGEMM选择合适的算子优化分支

NEON\SVE256

通过机型判断

KML_DSS_ZGEMM_ISA

求解器内部ZGEMM选择合适的算子优化分支

NEON\SVE256

通过机型判断

KML_DSS_DSYRK_ISA

求解器内部DSYRK选择合适的算子优化分支

NEON\SVE256

通过机型判断

KML_DSS_ZSYRK_ISA

求解器内部ZSYRK选择合适的算子优化分支

NEON\SVE256

通过机型判断

KML_DSS_DSYRKMM_ISA

求解器内部DSYRKMM选择合适的算子优化分支

NEON\SVE256

通过机型判断

KML_DSS_ZSYRKMM_ISA

求解器内部ZSYRKMM选择合适的算子优化分支

NEON\SVE256

通过机型判断

KML_DSS_SGETRF_ISA

求解器内部SGETRF选择合适的算子优化分支

NEON\SVE256

通过机型判断

KML_DSS_DGETRF_ISA

求解器内部DGETRF选择合适的算子优化分支

NEON\SVE256

通过机型判断

KML_DSS_CGETRF_ISA

求解器内部 CGETRF选择合适的算子优化分支

NEON\SVE256

通过机型判断

KML_DSS_ZGETRF_ISA

求解器内部ZGETRF选择合适的算子优化分支

NEON\SVE256

通过机型判断

KML_DSS_DPOTRF_ISA

求解器内部DPOTRF选择合适的算子优化分支

NEON\SVE256

通过机型判断

通过机型判断指在TaiShan 200 1280、TaiShan 200 2280上默认值为NEON,TaiShan 200 1280 V2;TaiShan 200 2280 V2机器上默认值为SVE256