中文
注册
我要评分
文档获取效率
文档正确性
内容完整性
文档易理解
在线提单
论坛求助

创建进程/线程分析任务

功能描述

进程/线程分析借鉴业界的USE方法,采集进程/线程对CPU、内存、存储IO等资源的消耗情况,获得对应的使用率、饱和度、错误次数等指标,以此识别性能瓶颈。针对部分指标项,根据当前已有的基准值和优化经验提供优化建议。支持分析单个进程的系统调用情况。

  • 如果环境中sysstat版本低于11.0.0,进程/线程分析任务结果可能出现异常数据。
  • 采集GPU数据时,仅支持2022.5.1及之前的nsight system版本;采集GPU调用栈数据时,仅支持2022.3.4及之前的nsight system版本。

操作实践可参见表1

表1 实例参考

实例类型

实例名称

代码样例

矩阵分析

列访问循环检测优化

锁频繁抢占

前提条件

不存在“离线”状态的节点。

创建进程/线程分析任务

  1. 单击系统性能分析后面的

    选择“通用分析”,打开新建任务页面。

  2. 参考“任务管理”和表2配置任务参数。
    新建进程/线程分析任务,如图1
    图1 新建进程/线程分析任务
    表2 新建进程/线程分析任务参数说明

    参数

    说明

    任务名称

    输入分析任务的名称。名称需要满足如下要求:

    1. 只能由中文、字母、数字和下划线组成
    2. 长度为1~64个字符

    选择节点

    选择需要分析的节点;只有一个节点时默认勾选,最多支持10个节点。

    分析对象

    选择“系统”或“应用”。

    模式

    选择“Launch application”或“Attach to process”。

    分析对象选择“应用”时需配置此参数。

    应用

    输入待分析应用的绝对路径。例如分析保存在“/home/test”目录下的“loop_test”应用,则输入:/home/test/loop_test

    分析对象选择“应用”,模式选择“Launch application”时需配置此参数。

    说明:
    • 默认分析“/opt/”或者“/home/”目录下的应用,管理员用户可在首页右上方的“>工具设置>系统性能分析>系统设置”中,手动配置“应用程序路径配置”,路径之间采用分号分隔。仅管理员用户可修改,普通用户只有查看权限。

      应用程序路径建议配置为 “/home”、“/opt”等,请不要配置为“/”、“/dev”、“/sys”、“/boot”等系统目录,否则可能导致系统异常。

    • 对于保存应用的目录,系统性能分析工具程序的操作系统运行用户(devkitworker1)对于待分析的应用需要有可读可执行权限。
    • 多节点场景下,打开“配置指定节点参数”选项可单独配置各节点的该参数。

    应用运行用户(可选)

    分析对象选择“应用”,模式选择“Launch application”时可配置该参数,默认关闭。

    • 关闭状态:应用运行用户为系统默认用户devkitworker1。
    • 打开状态:应用运行用户为实际配置的用户。

    用户名

    输入运行应用的操作系统用户。

    “应用运行用户”选项打开时需配置。

    密码

    输入用户的密码。

    “应用运行用户”选项打开时需配置。

    应用参数 (可选)

    输入应用参数,请根据实际应用场景填写。

    分析对象选择“应用”,模式选择“Launch application”可配置此参数。

    说明:

    打开“配置指定节点参数”时各节点可单独配置该参数。

    进程名

    输入进程名称,进程名称支持输入正则表达式。

    分析对象选择“应用”,模式选择“Attach to process”时需配置此参数。

    PID(可选)

    输入要分析的进程的PID,最多输入128个,中间用英文逗号分割。PID和进程名可以同时配置。

    分析对象选择“应用”,模式选择“Attach to process”可配置此参数。

    说明:
    • “Attach to process” 针对正在运行的应用程序(系统性能分析工具程序的操作系统运行用户(devkitworker1)针对运行的应用程序需要有可读权限),通过关联到运行该应用程序的PID的方式,来实时跟踪和采集该应用程序的性能数据。
    • 进程的PID可执行ps -ef | grep 程序名称查询。
    • 打开“配置指定节点参数”时各节点可单独配置该参数。

    分析类型

    选择“进程/线程分析”。

    采样时长 (s)

    设置采样的时间。默认为60秒,取值范围2~300秒。

    延迟采样时长(s)

    用于指定时间后执行分析,可以忽略程序的启动流程分析或用于采集程序热身,消除环境检测等带来的采集延迟。默认为0秒,取值范围0~900秒。

    分析对象选择“应用”,模式选择“Launch application”时需配置此参数。

    采样间隔 (s)

    设置采样间隔,默认为1秒。

    说明:

    采样间隔应当小于或等于采样时长的1/2且最大为10s。

    采样类型

    选择需要采集的类型。默认勾选“CPU”、“内存”和“存储IO”,可选择:

    • CPU
    • 内存
    • 存储IO
    • 上下文切换
    • GPU(分析对象选择应用,模式选择“Launch application”)

    GPU采集类型

    选择需要采集的类型;分析对象选择应用,模式选择“Launch application”,采样类型勾选GPU时需配置。默认全选,可选择:

    • GPU统计
    • CUDA API
    • GPU访存时延统计
    • GPU访存大小统计
    • cuBLAS
    • NVTX
    • OS runtime

    采集GPU调用栈(可选)

    是否采集调用栈信息;默认关闭。分析对象选择应用,模式选择“Launch application”,采样类型勾选“GPU”时在“高级配置”中可配置。

    采集线程信息(可选)

    是否采集线程信息。默认打开,暂不包含GPU。在“高级配置”中可配置此参数。

    跟踪系统调用(可选)

    是否采集应用程序在Linux系统下系统函数调用的信息。默认关闭,暂不包含GPU。

    分析对象选择“应用”时在“高级配置”中可配置此参数。

    说明:

    对于某些系统调用频繁的应用程序,开启跟踪系统调用会导致系统性能大幅度下降,不建议在生产环境上使用。

    任务时间

    配置任务是否立即执行,默认选择“立即执行”,可选“立即执行”和“预约定时启动”;“高级配置”中需配置。

    选择“预约定时启动”时,需配置“采集方式”、“采集时间”和“采集日期”。

    周期采集:该任务在采集周期内每天生效一次;周期采集需配置“采集时间”和“采集日期”。

    单次采集:该任务只生效一次;单次采集需配置“采集日期和时间”。

    说明:
    • 单个用户最多可创建20个预约任务。
    • 新创建的预约任务会出现在右上角“>工具设置>系统性能分析”中的“预约任务”列表中,可在“预约任务”列表中查看、修改和删除(可批量删除)预约任务。
    • 预约任务暂不支持重启,有预约的任务暂无重启按钮。
    • 开启应用运行用户时,任务无法预约定时启动,只能立即执行。
  3. 单击“确认”完成分析任务的创建。

    单击任务名称后面对应的图标可以执行如下操作:

    • :取消分析任务,取消分析任务后,已采集的信息会被删除。
    • :重启分析任务,可修改任务参数配置并重新启动分析任务,取消任务或任务失败时可使用。
    • :删除分析任务,删除分析任务会将该分析任务下的数据都删除,请谨慎操作。
    • :再次分析任务,自动命名任务并重新启动分析任务。
    • :修改任务或报告名称,可修改对应任务或报告名称(报告名称规则同任务名称一致)。