简介
本文主要介绍如何在使用CentOS或openEuler操作系统的鲲鹏服务器上安装Greenplum、安装并使能KAEzip以及使能KAEzip后为数据库OLAP场景查询性能带来的提升效果,并提供了Greenplum运行SQL时遇到故障的解决方法。
- Greenplum是一种基于PostgreSQL的分布式数据库,采用shared-nothing架构,实现了高性能的MPP(Massively Parallel Processing)架构。它是由数个独立的数据库服务组合成的逻辑数据库,可实现关系型数据库集群的功能。本文档部署使用的是Greenplum 6.0.0版本。
Greenplum的集群架构如图1所示。
KAEzip 是鲲鹏加速引擎KAE(Kunpeng Accelerator Engine)的压缩模块。KAEzip使用鲲鹏硬加速模块实现deflate算法,结合无损用户态驱动框架,提供了高性能Gzip/zlib格式的压缩接口。本次部署使用的是KAE-kae1_zip_process-level-init版本。- 支持zlib/Gzip数据格式,符合RFC1950/RFC1952标准规范。
- 支持deflate算法。
- 支持同步模式。
- 单处理器(鲲鹏920处理器)最大压缩带宽7GB/s,最大解压带宽8GB/s。
- 支持的压缩比≈2,与zlib 1.2.11接口保持一致。
KAE的系统逻辑架构如图2所示。
使能KAEzip之前,Greenplum默认调用的是zlib接口;使能KAEzip后,由于KAEzip的接口和zlib的接口的函数名称是相同的,因此Greenplum会调用KAEzip中的接口。KAEzip中的硬加速模块加快了数据库OLAP场景查询过程中的解压缩速度。在同一时间只处理一个请求、IO占比多的场景下,端到端的性能得到了显著提升,可以提升10%。