确定GPU拓扑结构

硬件配置方案一

  1. 获取GPU渲染节点命令。

    1
    ll /dev/dri/by-path/ | grep renderD
    

    回显示例如下。

    1
    2
    lrwxrwxrwx 1 root root 13 Oct 25 10:58 pci-0000:03:00.0-render -> ../renderD128
    lrwxrwxrwx 1 root root 13 Oct 25 10:58 pci-0000:83:00.0-render -> ../renderD129
    

    说明该服务器插了两张AMD GPU,渲染节点分别为renderD128,renderD129。

  2. 查询NUMA节点命令。

    1
    cat /sys/bus/pci/devices/0000\:XX\:00.0/numa_node 
    

    其中,指令中的“XX”应按1中的实际回显IP地址进行修改。以回显renderD128为例,查询指令应为:

    1
    cat /sys/bus/pci/devices/0000\:03\:00.0/numa_node
    

    回显如下所示。

    1
    0
    

    该回显表明GPU渲染节点renderD128所在NUMA节点为0。

硬件配置方案二、三

查看GPU节点所属的NUMA节点。
1
lspci -vvv -d :0200 | grep NUMA
GCH GPU DC1000每张单卡对应有4个GPU节点,回显输出的每行和GPU节点(renderD节点128)顺序依次对应。示例回显如下:
 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
NUMA node: 0
NUMA node: 0
NUMA node: 0
NUMA node: 0
NUMA node: 0
NUMA node: 0
NUMA node: 0
NUMA node: 0
NUMA node: 2
NUMA node: 2
NUMA node: 2
NUMA node: 2
NUMA node: 2
NUMA node: 2
NUMA node: 2
NUMA node: 2

当前回显表示/dev/dri/目录下的渲染节点renderD128~143中,renderD128~135属于NUMA0,renderD136~143属于NUMA2。