环境变量配置
以下环境变量会用于应用数学库中:
环境变量名: |
变量意义: |
有效值: |
默认值 |
---|---|---|---|
HGEMM_F16F16F32_MAX_KB |
设置hgemm最大kb数 |
整数 |
1'000'000'000'000L |
KML_SCADSS_VARIANT |
scadss调度策略 |
整数(0|1),默认0 |
0 |
KSCALAPACK_REDIST_TO_LOCAL_APPLICABLE |
scalapack本地内存适配 |
O\D\F |
D |
KML_NUM_THREADS |
local线程数设置 |
整数 |
0 |
KML_THREAD_USING_POLICY |
线程使用策略 |
整数 |
2 |
KML_CFMA_ACCELERATION |
使用CFMA加速复数 |
整数 |
0 |
KML_SKIP_ZEROS |
使用GEMM的skip-zeros模式加速零较多的矩阵乘 |
整数 |
1 |
KML_GEMM_TO_GEMM3M |
使用GMEMM3M |
整数 |
0 |
KML_ALLOCATE_POLICY |
alloc规则 |
整数 |
0 |
KML_ALLOCATE_HUGEPAGE_SIZE |
alloc大页规模 |
整数 |
512*1024*1024 |
KML_PXGETRF_FORCE_CALU |
pgetrf函数使用CALU算法 |
整数 |
0 |
KML_FAST_EIGENSOLVER |
使用高性能版本特征值求解器 |
整数 |
1 |
KML_TSQR_CHECK |
对于高瘦型QR分解进行结果检查 |
整数 |
0 |
KML_MPI_USE_SHARED_MEMORY |
MPI使用共享内存 |
整数 |
1 |
OMP_PLACES |
OMP内置参数 |
cores |
- |
OMP_PROC_BIND |
OMP内置参数 |
TRUE |
- |
KML_VERBOSE |
打印等级 |
0/1/2/3 |
0 |
环境变量名: |
变量意义: |
有效值: |
默认值 |
---|---|---|---|
KML_DSS_SCHE_MODE |
DSS调度模式 |
STATIC\DYNAMIC\KPCCL\LAST |
LAST |
KML_DSS_SGEMM_ISA |
求解器内部SGEMM选择合适的算子优化分支 |
NEON\SVE256 |
通过机型判断 |
KML_DSS_DGEMM_ISA |
求解器内部DGEMM选择合适的算子优化分支 |
NEON\SVE256 |
通过机型判断 |
KML_DSS_CGEMM_ISA |
求解器内部CGEMM选择合适的算子优化分支 |
NEON\SVE256 |
通过机型判断 |
KML_DSS_ZGEMM_ISA |
求解器内部ZGEMM选择合适的算子优化分支 |
NEON\SVE256 |
通过机型判断 |
KML_DSS_DSYRK_ISA |
求解器内部DSYRK选择合适的算子优化分支 |
NEON\SVE256 |
通过机型判断 |
KML_DSS_ZSYRK_ISA |
求解器内部ZSYRK选择合适的算子优化分支 |
NEON\SVE256 |
通过机型判断 |
KML_DSS_DSYRKMM_ISA |
求解器内部DSYRKMM选择合适的算子优化分支 |
NEON\SVE256 |
通过机型判断 |
KML_DSS_ZSYRKMM_ISA |
求解器内部ZSYRKMM选择合适的算子优化分支 |
NEON\SVE256 |
通过机型判断 |
KML_DSS_SGETRF_ISA |
求解器内部SGETRF选择合适的算子优化分支 |
NEON\SVE256 |
通过机型判断 |
KML_DSS_DGETRF_ISA |
求解器内部DGETRF选择合适的算子优化分支 |
NEON\SVE256 |
通过机型判断 |
KML_DSS_CGETRF_ISA |
求解器内部 CGETRF选择合适的算子优化分支 |
NEON\SVE256 |
通过机型判断 |
KML_DSS_ZGETRF_ISA |
求解器内部ZGETRF选择合适的算子优化分支 |
NEON\SVE256 |
通过机型判断 |
KML_DSS_DPOTRF_ISA |
求解器内部DPOTRF选择合适的算子优化分支 |
NEON\SVE256 |
通过机型判断 |

通过机型判断指在TaiShan 200 1280、TaiShan 200 2280上默认值为NEON,TaiShan 200 1280 V2;TaiShan 200 2280 V2机器上默认值为SVE256