bcm zk集群故障导致客户端进程coredump
问题现象描述
bcm zk集群发生故障时,客户端调用rbd查询pool信息,初始化失败退出,生成core
关键过程、根本原因分析
从客户端回显可以看出zk连接失败,进一步观察gcache.log的日志
可以看出当时bcm zk集群存在故障,无法连接,客户端rbd命令初始化连接zk失败不会重试,走初始化失败流程调abort,导致生成core
结论、解决方案及效果
此为正常现象,需要先将bcm zk集群故障修复,修复后重新调用即可成功
父主题: 客户端进程异常