网络服务占用的CPU与容器绑定的CPU重叠时,会造成容器内CPU资源异常。为了避免这种情况出现,请将流量较大、负载较重的网卡绑定至空闲CPU。
1 | ethtool -i enp125s0f1 | grep bus-info | awk '{print $2}' |
回显如下所示,表示网卡enp125s0f1的pci设备号为0000:7d:00.1。
1 | 0000:7d:00.1 |
1 | cat /proc/interrupts | grep "${id_pci}" | awk -F: '{print $1}' |
回显如下所示,表示网卡对应的中断为358、359。
1 2 | 358 359 |
若查询网卡涉及的中断时,回显包含多个中断号,则需要判断中断是否分散地绑在不同CPU上,根据判断结果来确定是否修改中断绑定的CPU。
1 | cat /proc/irq/${break_value}/smp_affinity_list |
1 | lspci -vvvs ${id_pci} |
回显如下所示,根据pci设备号查询得到的网卡enp125s0f1所属的NUMA node为0。
1 2 3 4 5 6 7 8 | 7d:00.1 Ethernet controller: Huawei Technologies Co., Ltd. HNS GE/10GE/25GE Network Controller (rev 21) Control: I/O- Mem+ BusMaster+ SpecCycle- MemWINV- VGASnoop- ParErr- Stepping- SERR- FastB2B- DisINTx- Status: Cap+ 66MHz- UDF- FastB2B- ParErr- DEVSEL=fast >TAbort- <TAbort- <MAbort- >SERR- <PERR- INTx- Latency: 0 NUMA node: 0 Region 0: Memory at 121040000 (64-bit, prefetchable) [size=64K] Region 2: Memory at 120400000 (64-bit, prefetchable) [size=1M] Capabilities: [40] Express (v2) Endpoint, MSI 00 |
命令中的${break_1}、${break_2}依次为两个网卡中断的值。
1 | echo 1 > /proc/irq/${break_1}/smp_affinity_list |
1 | echo 2 > /proc/irq/${break_2}/smp_affinity_list |
以网卡enp125s0f1为例,它对应的中断为358、359,绑定命令依次为:
1 2 | echo 1 > /proc/irq/358/smp_affinity_list echo 2 > /proc/irq/359/smp_affinity_list |
查询得到网卡所属的NUMA node后,NUMA node对应的core区间可执行如下命令查看。
1 | lscpu |
如回显所示,NUMA node0其对应的core区间为0~31。
1 2 3 4 | NUMA node0 CPU(s): 0-31 NUMA node1 CPU(s): 32-63 NUMA node2 CPU(s): 64-95 NUMA node3 CPU(s): 96-127 |