中文
注册
我要评分
文档获取效率
文档正确性
内容完整性
文档易理解
在线提单
论坛求助

鲲鹏加速库

对软件基础库做深度性能优化,构建常用软件库在鲲鹏计算平台上的性能竞争力。

成长地图

由浅入深,带您玩转鲲鹏加速库

加速库全景

华为鲲鹏计算加速库是华为公司围绕鲲鹏处理器进行性能优化后的软件集合的统称,主要分为压缩、加解密、系统库、媒体、数学库、存储、网络和AI库8大类。

压缩

使用鲲鹏硬件加速模块或鲲鹏指令对业界主流的开源压缩库进行性能优化。

加解密

使用鲲鹏硬件加速模块及鲲鹏指令对OpenSSL库进行性能优化,支持硬加速与指令加速的自动协同、应用逻辑无需修改即可使用加解密加速库。

系统库

基于鲲鹏微架构特点,使用鲲鹏指令对系统通用的基础库进行性能优化,以及x86平台的指令函数映射到鲲鹏平台的公共模块。

媒体

基于鲲鹏加速指令提供高性能媒体原语库及视频编解码库。

数学库

基于鲲鹏微架构特点以及鲲鹏加速指令,提供常用的高性能基础数学库。

存储

采用高速缓存盘配合高效的预取算法,提升系统存储IO性能,进而提升存储IO密集型场景的整体性能。

网络

基于鲲鹏架构特点,提供TCP/IP和OVS网络加速技术。

AI库

提供基于鲲鹏平台优化的高性能AI算子库。

压缩

KAEzip是鲲鹏加速引擎的压缩模块,使用鲲鹏硬加速模块实现deflate算法,结合无损用户态驱动框架,提供高性能gzip/zlib格式压缩接口。

了解

安装

使用

通过加速引擎可以实现不同场景下应用性能的提升,例如在分布式存储场景下,通过zlib加速库加速数据压缩和解压。

加解密

KAE加解密是鲲鹏加速引擎的加解密模块,使用鲲鹏硬加速模块实现RSA/SM3/SM4/DH/MD5/AES算法,结合无损用户态驱动框架,提供高性能对称加解密、非对称加解密算法能力,兼容OpenSSL 1.1.1x和OpenSSL 3.0.x系列版本,支持同步和异步机制。

了解

安装

使用

通过加速引擎可以实现不同场景下应用性能的提升,例如在Web服务应用场景下,通过KAE加速RSA算法可以加速握手连接;在智能安防场景下,通过KAE加速SM4对称加解算法加速视频流数据存储。

接口参考

系统库

鲲鹏系统库(KSL)

鲲鹏系统库,简称KSL(Kunpeng System Library)是华为提供的基于鲲鹏平台优化的高性能系统函数库。由AVX2KI、KQMalloc、HTL、KSL_ASN1和KHSEL子库组成。

了解

KQMalloc

鲲鹏高性能内存库KQMalloc(Kunpeng Quick Malloc),是专为鲲鹏920系列处理器设计的内存分配器。此分配器分为单线程和多线程应用场景,最大限度地减少内部缓存占用空间,最大限度地减少内部缓存未命中,可极大地提升应用性能。


AVX2KI是一款接口集合库。当使用Intrinsic类接口的应用程序从传统平台迁移到鲲鹏计算平台时,由于各个平台的Intrinsic函数定义不同,需要逐一对于Intrinsic函数重新进行适配开发。

HTL

HTL(Hyper Thread Library)是构建在内核态线程之上的用户级线程库。用于解决内核级线程大量使用时,应用性能下降,系统资源不足的问题,尤其解决嵌套并行场景下性能极低的问题。在保障减少资源使用的情况下,提升并发度,改善性能。

KSL_ASN1

ASN.1(Abstract Syntax Notation One)是定义抽象数据类型规格形式的一套标准,是描述数据的表示、编码、传输、解码的灵活的一种记法。KSL_ASN1是开源ASN.1软件的国产化替换,目前支持PER和BER格式,性能相较开源软件asn1c有较大的提升。

HAF

HAF(Homogeneous Acceleration Framework)提供用户友好的编程方式和API,快速、有效、安全地使能用户业务程序指定加速片段卸载推送至卸载节点执行,带来用户预期的卸载优化效果。

Hyperscan
Hyperscan是一款高性能的正则表达式匹配库,它是以PCRE为原型开发,并以BSD许可证开源,遵循libpcre库通用的正则表达式语法,拥有独立的C语言接口。在Hyperscan正式发布版本的基础上,参考华为鲲鹏微架构特征,重新设计核心接口的实现机制,并完成了开发和性能优化,推出适合鲲鹏计算平台的软件包。
毕昇JDK加速库

毕昇JDK是基于OpenJDK开发的Huawei JDK开源版本,基于鲲鹏处理器提供了一些加速能力,如堆转储增强、JBooster特性和JBolt特性的加速。其中,堆转储增强特性支持毕昇JDK 8和17版本;JBooster特性和JBolt特性仅支持毕昇JDK 17版本。

了解

使能特性

媒体

HMPP
HMPP(Hyper Media Performance Primitives)是鲲鹏加速库中媒体库其中的一个加速部件,通过鲲鹏处理器支持的NEON加速指令集对信号处理和图像处理业务功能提供高性能加速函数接口,例如信号傅里叶变换、信号滤波、AI处理、图片转换和3D处理等,让客户的业务程序在华为鲲鹏处理器平台实现业务加速。

了解

接口函数

KVSIP

KVSIP(Kunpeng Vector Signal Processing)提供了高性能计算接口,包括向量基础运算、矩阵基础运算和快速傅里叶运算功能,支持在鲲鹏平台使用。

了解

接口函数

鲲鹏计算视觉库
鲲鹏计算视觉库,简称KPCV(Kunpeng Computer Vision)汇聚了基于OpenCV图算子的优化、PyTorch图算子优化,利用鲲鹏向量指令对其中的图像处理算子进行性能优化

了解

算子说明

存储

鲲鹏智能预取是华为公司原创的存储加速库。针对分布式存储、大数据的Spark/HBase等解决方案中的存储IO密集型场景,采用高速缓存盘配合高效的预取算法,提升系统存储IO性能,进而提升上述解决方案中存储IO密集型场景的整体性能。

安装与配置

使用指导

网络

XPF
XPF(Extensible Packet Framework)加速库是鲲鹏自研加速库。
DPDK

DPDK(Data Plane Development Kit)为用户空间高效的数据包处理提供数据平面开发工具集,包括库函数和驱动。

AI库

鲲鹏AI库KAIL(Kunpeng Artificial Intelligence Library)是华为提供的基于鲲鹏平台优化的高性能AI算子库,主要完成深度神经网络算子库和拓展算子库,拓展算子包括softmax、random_choice等。

说明:鲲鹏AI库文档为受限发布。请您先尝试根据页面提示申请文档的阅读权限。如果仍无法解决问题,请您联系华为一线技术支持工程师处理。