中文
注册
我要评分
文档获取效率
文档正确性
内容完整性
文档易理解
在线提单
论坛求助
鲲鹏小智

工具介绍

本工具在鲲鹏Devkit安装目录中(以鲲鹏Devkit安装在/opt为例,工具路径为/opt/DevKit/devkitplugins/sys_perf/tools)。

工具免安装,目录结构如下:

--Hyper-Tuner_linux_HPC-Tools
----hpccollector                         #HPC采集工具
----hpcreport                            #HPC报告展示工具
----hpcdld                               #MPI deadlock detection
----hpcmanager                           #任务管理工具
----devkit                               #工具依赖
----devkit_lib                           #工具依赖
----check_latency_bandwidth              #检查内存、网络带宽和时延的工具
----stream_benchmark.sh                  #stream benchmark脚本
----readme.txt                           #工具介绍
----hpcmanager_readme.txt                #hpcmanager介绍
----hpcreport_readme.md                  #hpcreport介绍
----hpcdld_readme.txt                    #hpcdld介绍

hpccollector、hpcreport、hpcmanager是MPI场景采集分析软件;hpcdld是MPI死锁检测软件;check_latency_bandwidth、stream_benchmark.sh是benchmark的测试软件,可使用-h/--help查看帮助,devkit和devkit_lib下置相关依赖工具,工具必须与依赖目录处于同一目录,否则无法运行,即上述结构中Hyper-Tuner_linux_HPC-Tools目录,下文工具所在目录统一称为INSTALL_PATH。运行工具进行采集分析,分析结果置于INSTALL_PATH/package目录,为压缩包格式,每次成功的任务结果汇报压缩包所在路径,将该压缩包通过系统性能分析工具Web界面的项目导入入口,在线查询可视化图表分析结果,注意Web工具版本和命令行工具版本一致。

工具使用要求:

  1. 可用的mpi运行集群,包括正常使用的mpirun命令、shared folder。
  2. 必要的linux工具,如:cat,pstree,perf;相关工具参数: /proc/sys/kernel/perf_event_paranoid值为 -1;相关工具参数: /proc/sys/kernel/kptr_restrict值为0。
  3. 集群节点可使用内存大于10G,否则可能导致采集失败,采集数据过少。
  4. 集群节点tmp目录可用,且剩余空间大于10G,否则可能导致采集失败,采集数据过少。
  5. 集群shared folder可用,且剩余空间大于10G。
  6. 不可以使用tmp目录作为shared folder目录。