工具介绍
本工具在鲲鹏Devkit安装目录中(以鲲鹏Devkit安装在/opt为例,工具路径为/opt/DevKit/devkitplugins/sys_perf/tools)。
工具免安装,目录结构如下:
--Hyper-Tuner_linux_HPC-Tools ----hpccollector #HPC采集工具 ----hpcreport #HPC报告展示工具 ----hpcdld #MPI deadlock detection ----hpcmanager #任务管理工具 ----devkit #工具依赖 ----devkit_lib #工具依赖 ----check_latency_bandwidth #检查内存、网络带宽和时延的工具 ----stream_benchmark.sh #stream benchmark脚本 ----readme.txt #工具介绍 ----hpcmanager_readme.txt #hpcmanager介绍 ----hpcreport_readme.md #hpcreport介绍 ----hpcdld_readme.txt #hpcdld介绍
hpccollector、hpcreport、hpcmanager是MPI场景采集分析软件;hpcdld是MPI死锁检测软件;check_latency_bandwidth、stream_benchmark.sh是benchmark的测试软件,可使用-h/--help查看帮助,devkit和devkit_lib下置相关依赖工具,工具必须与依赖目录处于同一目录,否则无法运行,即上述结构中Hyper-Tuner_linux_HPC-Tools目录,下文工具所在目录统一称为INSTALL_PATH。运行工具进行采集分析,分析结果置于INSTALL_PATH/package目录,为压缩包格式,每次成功的任务结果汇报压缩包所在路径,将该压缩包通过系统性能分析工具Web界面的项目导入入口,在线查询可视化图表分析结果,注意Web工具版本和命令行工具版本一致。
工具使用要求:
- 可用的mpi运行集群,包括正常使用的mpirun命令、shared folder。
- 必要的linux工具,如:cat,pstree,perf;相关工具参数: /proc/sys/kernel/perf_event_paranoid值为 -1;相关工具参数: /proc/sys/kernel/kptr_restrict值为0。
- 集群节点可使用内存大于10G,否则可能导致采集失败,采集数据过少。
- 集群节点tmp目录可用,且剩余空间大于10G,否则可能导致采集失败,采集数据过少。
- 集群shared folder可用,且剩余空间大于10G。
- 不可以使用tmp目录作为shared folder目录。
父主题: HPC命令行工具