网卡故障或配置错误而导致网卡不可达的解决方法
问题现象描述
当系统出现网卡故障或配置错误而导致网卡不可达时,运行在OmniShuffle Shuffle加速上的业务可能出现失败,该节点上的OCKD进程也将无法被纳入OmniShuffle Shuffle加速集群进行管理。
关键过程、根本原因分析
无
结论、解决方案及效果
管理员通过相关监测方式获取发生过网卡故障的节点信息,并重新启动所在节点的OCKD进程后,该节点将会被重新纳入OmniShuffle Shuffle加速集群进行管理,之后该节点将可以正常执行任务。
父主题: 故障排除