鲲鹏亲和性优化
鲲鹏BoostKit大数据算法加速库从多个方面进行了优化,大幅提升了大数据算法场景的计算性能。
访存优化
在PCA等算法中,需要计算大规模矩阵的格莱姆矩阵,BoostKit算法库利用鲲鹏Cache容量大的特点,对矩阵进行分块和重排,提升Cache命中率,进而提升访存效率。在同等精度下,PCA等算法性能提升50%以上。
图1 鲲鹏BoostKit优化方案
多核并行计算
在树模型算法中,通过数据并行和模型并行相融合的方式,在通信量不变的情况下提升算法并行度,从而发挥鲲鹏的多核优势。随机森林、GBDT等树模型算法性能提升50%以上。
图2 鲲鹏BoostKit优化方案
父主题: 关键技术