中文
注册

示例7:MPI+OpenMP统计分析

简介

本示例主要针对MPI应用程序,通过鲲鹏性能分析工具HPC应用分析功能的检测,指导用户如何使用HPC应用分析功能。

环境准备

  1. 请确认服务器上的CPU是否为Kunpeng 920,操作系统内核为4.19及以上或patched openEuler 4.14内核及以上。
  2. 请确认服务器上GCC版本是否为7.3.0及以上。
  3. 请确认服务器上是否已安装鲲鹏DevKit系统性能分析工具。
  4. 请从Github下载代码样例ring.c,执行以下命令赋予所有用户可读、可写和可执行权限。
    chmod 777 ring.c 

分析过程

  1. 代码样例准备。

    编译ring.c,并赋予可执行文件所有用户可读、可写和可执行权限。

    mpicc ring.c -O3 -o ring -fopenmp -lm && chmod 777 ring
  2. 创建HPC应用分析任务,并启动分析。
    表1 配置参数说明

    参数

    说明

    分析对象

    应用。本示例要分析确定MPI程序,所以不需要在服务器上运行程序,而是直接在工具中选择需要运行的程序,当前是ring程序。

    模式

    Launch Application

    应用路径

    输入程序所在的绝对路径,例如本示例将代码样例放在服务器“/opt/testdemo/mpi/ring”路径下(多节点环境下应用在对应目录下存在)。

    分析类型

    HPC应用分析

    采集模式

    MPI/MPI+OpenMP混合模式;本示例主要是对MPI的应用进行分析,所以选择MPI/MPI+OpenMP混合模式。

    共享目录

    单节点情况下填入系统存在的目录,多节点情况下需填入节点间的共享目录;例如本示例是在两个节点下进行采集所以填入节点间的共享目录“/home/share”。

    mpirun所在路径

    mpirun命令所在绝对路径。

    mpirun参数

    --allow-run-as-root -H 节点IP:rank数(例如:--allow-run-as-root -H 192.168.1.10:10)

    分析模式

    统计分析

    采样模式

    Detail

    采样时长

    10秒

    其他参数

    默认;用户名和密码等参数需按实际配置。

  3. 查看分析结果。
    图1 HPC应用分析结果总览

    图1所示 “总览” 页签上方会展示相关的优化建议以及程序的执行时间,CPU使用率,CPU cycles/Retired instruction的比值(CPI),执行的指令数(Instruction Retired),消耗在MPI阻塞函数上的时间百分比(MPI wait rate)等。

    图2 Hotspots

    图2所示 Hotstpots区域会展示出应用中热点函数调用CPU相关情况。分组方式认为“function”选项,还可选“module”、“parallel-region”和“barrier-to-barrier-segment”。

    图3 内存带宽+HPC Top-Down

    图3所示,内存带宽区域展示当前应用程序调用带宽的相关信息,并展示相关的指令分布(鼠标悬停于参数旁边的问号上可查看详细信息)。HPC Top-Down 会展示Top-Down事件名称及事件比例(鼠标悬停于参数旁边的上可查看详细信息)。

    图4 MPI运行指标+PMU事件

    图4所示 MPI运行时指标会展示当前MPI应用运行时的相关数据。PMU事件计数会展示出对当前相关PMU事件及数量。

    图5 MPI节点

    图5所示,单击“MPI节点”页签查看各个节点任务的执行信息,支持20万+核集群中Top N MPI热节点分析。

  • 如果任务执行失败,“任务信息”界面上会显示任务失败的原因。
  • 如果任务执行成功,但有部分不影响整体的数据采集失败,可查看“异常信息”。
  • “采集结束原因”可表明当前任务数据采集结束原因,如“到达任务采集时间”。
搜索结果
找到“0”个结果

当前产品无相关内容

未找到相关内容,请尝试其他搜索词