Ceph osd coredump
问题现象描述
在进行IO压力测试时,服务端ceph osd进程概率性触发coredump,coredump栈参见下图。
解决方案
需要对TCMalloc进程重编,下面选择2.7稳定版本进行重编示例,可按需选择更高版本进行重编。
- 获取TCMalloc 2.7源码。
下载地址:https://github.com/gperftools/gperftools/releases/download/gperftools-2.7/gperftools-2.7.tar.gz
- 将源码上传至服务器解压,重新编译TCMalloc。
tar zxvf gperftools-2.7.tar.gz cd gperftools-2.7 mkdir build; cd build ../configure --prefix=/usr/local/tcmalloc --with-tcmalloc-pagesize=64K make -j 16 make install
--with-tcmalloc-pagesize=64K将PageSize配置为64KB,与OS保持一致。
- 配置环境变量。
echo '/usr/local/tcmalloc/lib/' >> /etc/ld.so.conf ldconfig
- 重启Ceph。
systemctl restart ceph.target
父主题: Ceph故障